Ferramentas para coleta de dados em redes sociais

Share on Facebook
Bookmark this on Delicious
Share on StumbleUpon

Os sites de redes sociais tem sido cada vez mais objeto de estudos acadêmicos, mas as metodologias de coleta e análise desse tipo de dados ainda não estão consolidadas. Apesar da grande quantidade de informação disponível – ainda que temporariamente – plataformas eficientes para armazenar e depois categorizar esses dados ainda estão sendo experimentadas para usos acadêmicos. Comercialmente, algumas ferramentas já são amplamente utilizadas (ex.: Scup, Radian 6, Brandwatch, Seekr, Livebuzz), mas seus custos geralmente não são compatíveis com o orçamento da maioria das pesquisas acadêmicas. Algumas delas inclusive lançaram planos gratuitos voltados especialmente para a área acadêmica (vide a do Livebuzz e a do Scup). Apesar de limitados no tempo ou quantidade de coleta, eles podem ser úteis para pesquisas pequenas.

Uma outra ferramenta disponível gratuitamente é o Analytics for Twitter, que nada mais é do que um plugin para o Excel 2010. Instalando esse plugin, que está disponível na página da Microsoft, você pode buscar por um ou mais termos no Twitter e ter todas as menções a ele coletadas. Há uma limitação máxima de 1500 tweets por dia e, pela experiência que já tive com a ferramenta, ela não retroage mais que 7 dias na busca. De toda forma, isso já gera um banco de dados razoável, a depender dos propósitos da pesquisa. Os tweets coletados ficam armazenados e já vem automaticamente com categorizados em relação ao autor, hora, hashtags e perfis citados.

A imagem acima mostra algumas das categorias que o plugin já fornece automaticamente: as hashtags mais utilizadas – bastante útil quando você quer identificar as hashtags relacionadas a um tema, por exemplo -, os perfis mais mencionados quando se fala do termo pesquisado e os usuários que mais twitaram sobre o tema buscado.

As categorizações de horário não me parecem muito úteis, mas podem servir a pesquisas específicas. Já a análise de sentimento (positivo, negativo e neutro) é automática e geralmente bastante falha por não compreender nuances e ironias da língua. O tipo de tweet, no entanto, pode ser uma informação bastante útil pois permite ver a quantidade de tweets originais e a quantidade de retweets sobre o tema.

O maior problema da ferramenta é não fazer um monitoramento contínuo. Ou seja, você não pode estabelecer um período para que a coleta seja continuamente feita. Se você faz uma busca hoje e quer os dados de amanhã também, é preciso fazer uma nova busca e lidar com a possibilidade de tweets duplicados que podem ser coletados.

Nina Santos é mestranda em Comunicação e Política no Programa de Pós-Graduação em Comunicação e Culturas Contemporâneas – UFBA e aluna da especialização nessa mesma área. Pesquisa comunicação e política, democracia digital e empoderamento do cidadão no Centro de Estudos Avançados em Democracia Digital e Governo Eletrônico (CEADD-UFBA) e no Grupo de Pesquisa de Comunicação, Política e Redes Digitais.


Posts relacionados



2 comentários para “Ferramentas para coleta de dados em redes sociais”

  1. Ana Carolina Vimieiro disse:

    Ei Nina!
    Legal que vc tb tá coletando dados do Twitter. Comecei a trabalhar na minha pesquisa de doutorado agora (vou mexer c/Twitter) e uma ferramenta que o pessoal do grupo de pesquisa que eu trabalho tem mexido é o yourTwapperkeeper. É uma ferramenta open-source bastante interessante e segura. Vc precisa ter um servidor rodando 24h p/vc coletar o conteúdo e ele gera os dados em um formato (csv) que vc consegue processar na maioria dos softwares depois. Como todas as ferramentas, vc só consegue arquivar tweets que forem twittados a partir do momento que vc adicionar a palavra-chave na plataforma e pedir para iniciar o arquivamento. Mas com essa história de que os arquivos antigos do Twitter vão começar a ser comercializados, em breve será possível ter acesso a tweets com até 2 anos de postagem (mas vai ser pago, claro). Se vc quiser saber mais sobre os projetos do pessoal do grupo, tem vários detalhes aki: http://www.mappingonlinepublics.net/

    Especificamente sobre o yourTwapperkeeper, aki: http://www.mappingonlinepublics.net/2012/01/09/twapperkeeper-and-beyond-a-reminder/

    Não sei se seu projeto é exatamente sobre Twitter e eu acabo de começar a mexer com essas técnicas (então tô ainda engatinhando), mas depois podemos trocar umas figurinhas! :)

    abração!
    Carol

  2. Nina Santos disse:

    Legal, Carol! Vou tentar testar esse yourTwapperkeeper e vamos trocando figurinhas! :)

Deixe um comentário