Os sites de redes sociais tem sido cada vez mais objeto de estudos acadêmicos, mas as metodologias de coleta e análise desse tipo de dados ainda não estão consolidadas. Apesar da grande quantidade de informação disponível – ainda que temporariamente – plataformas eficientes para armazenar e depois categorizar esses dados ainda estão sendo experimentadas para usos acadêmicos. Comercialmente, algumas ferramentas já são amplamente utilizadas (ex.: Scup, Radian 6, Brandwatch, Seekr, Livebuzz), mas seus custos geralmente não são compatíveis com o orçamento da maioria das pesquisas acadêmicas. Algumas delas inclusive lançaram planos gratuitos voltados especialmente para a área acadêmica (vide a do Livebuzz e a do Scup). Apesar de limitados no tempo ou quantidade de coleta, eles podem ser úteis para pesquisas pequenas.
Uma outra ferramenta disponível gratuitamente é o Analytics for Twitter, que nada mais é do que um plugin para o Excel 2010. Instalando esse plugin, que está disponível na página da Microsoft, você pode buscar por um ou mais termos no Twitter e ter todas as menções a ele coletadas. Há uma limitação máxima de 1500 tweets por dia e, pela experiência que já tive com a ferramenta, ela não retroage mais que 7 dias na busca. De toda forma, isso já gera um banco de dados razoável, a depender dos propósitos da pesquisa. Os tweets coletados ficam armazenados e já vem automaticamente com categorizados em relação ao autor, hora, hashtags e perfis citados.
A imagem acima mostra algumas das categorias que o plugin já fornece automaticamente: as hashtags mais utilizadas – bastante útil quando você quer identificar as hashtags relacionadas a um tema, por exemplo -, os perfis mais mencionados quando se fala do termo pesquisado e os usuários que mais twitaram sobre o tema buscado.
As categorizações de horário não me parecem muito úteis, mas podem servir a pesquisas específicas. Já a análise de sentimento (positivo, negativo e neutro) é automática e geralmente bastante falha por não compreender nuances e ironias da língua. O tipo de tweet, no entanto, pode ser uma informação bastante útil pois permite ver a quantidade de tweets originais e a quantidade de retweets sobre o tema.
O maior problema da ferramenta é não fazer um monitoramento contínuo. Ou seja, você não pode estabelecer um período para que a coleta seja continuamente feita. Se você faz uma busca hoje e quer os dados de amanhã também, é preciso fazer uma nova busca e lidar com a possibilidade de tweets duplicados que podem ser coletados.
Ei Nina!
Legal que vc tb tá coletando dados do Twitter. Comecei a trabalhar na minha pesquisa de doutorado agora (vou mexer c/Twitter) e uma ferramenta que o pessoal do grupo de pesquisa que eu trabalho tem mexido é o yourTwapperkeeper. É uma ferramenta open-source bastante interessante e segura. Vc precisa ter um servidor rodando 24h p/vc coletar o conteúdo e ele gera os dados em um formato (csv) que vc consegue processar na maioria dos softwares depois. Como todas as ferramentas, vc só consegue arquivar tweets que forem twittados a partir do momento que vc adicionar a palavra-chave na plataforma e pedir para iniciar o arquivamento. Mas com essa história de que os arquivos antigos do Twitter vão começar a ser comercializados, em breve será possível ter acesso a tweets com até 2 anos de postagem (mas vai ser pago, claro). Se vc quiser saber mais sobre os projetos do pessoal do grupo, tem vários detalhes aki: http://www.mappingonlinepublics.net/
Especificamente sobre o yourTwapperkeeper, aki: http://www.mappingonlinepublics.net/2012/01/09/twapperkeeper-and-beyond-a-reminder/
Não sei se seu projeto é exatamente sobre Twitter e eu acabo de começar a mexer com essas técnicas (então tô ainda engatinhando), mas depois podemos trocar umas figurinhas!
abração!
Carol
Legal, Carol! Vou tentar testar esse yourTwapperkeeper e vamos trocando figurinhas!