No Twitter, é difícil encontrar notícias locais

Conforme os americanos usam cada vez mais as mídias sociais, os pesquisadores naturalmente estão interessados ​​em como os dados delas podem ser usados ​​para entender melhor como os usuários compartilham e discutem informações nessas novas plataformas. A massa de tweets, variando de comentários políticos a 'sentimento' geral sobre empresas, produtos ou serviços, tem muitas empresas de marketing e acadêmicos clamando por insights sobre o fluxo coletivo de consciência do Twitter.

Mas quão preciso é o Twitter como uma medida do sentimento público e como ele pode ser usado? No Pew Research Center, estamos especificamente interessados ​​em experimentar o papel do Twitter nas notícias desde 2008. Então, quando lançamos um projeto de um ano examinando notícias locais em três cidades no ano passado, testamos várias abordagens usando dados do Twitter para entender como ele serve como fonte de notícias e permite que os residentes locais se tornem participantes dela.

Nosso veredicto? Embora a análise do Twitter ainda esteja em estágio experimental e os dados do Twitter tenham limitações, pode ser uma nova ferramenta valiosa para entender o ambiente de mídia. Mais especificamente, achamos valioso entender como as organizações de notícias usam o Twitter. No entanto, as notícias locais são apenas um pequeno tópico de muitos discutidos na plataforma. O que achamos que faltava era tentar reunir quaisquer dados sobre os usuários do Twitter por localização.

Aqui está um resumo do que funcionou e do que não funcionou no uso do Twitter para pesquisa.

O que fizemos:

Queríamos entender o papel que o Twitter desempenha como fonte de notícias para residentes locais de três cidades de estudo de caso: Denver, Macon, Geórgia e Sioux City, Iowa. Isso incluiu o rastreamento de organizações de notícias tradicionais no Twitter, como jornais, televisão e estações de rádio, bem como os próprios jornalistas, como políticos, líderes comunitários e funcionários do governo. Para fazer isso, usamos principalmente o serviço Gnip para acessar o Twitter 'firehose', que se refere ao acesso a todos os tweets e metadados no Twitter.



Em vez de tomar os usuários do Twitter como um proxy para sua comunidade maior, simplesmente tratamos os usuários do Twitter em cada cidade como uma comunidade em si mesmas. Fizemos uma auditoria abrangente dos provedores de notícias em cada cidade e descobrimos que a maioria deles tinha contas no Twitter. Mesmo que uma porção relativamente pequena da população esteja no Twitter, o uso do Twitter pelas organizações de notícias pode servir como uma ferramenta útil para entender como as informações locais se espalham por uma comunidade.

Em segundo lugar, queríamos saber se os residentes de cada cidade estavam usando o Twitter para comentar, discutir e até mesmo participar de eventos de notícias. Experimentamos vários métodos diferentes antes de decidirmos por uma combinação de abordagens que melhor responderia às perguntas em questão.

Ao fazer essa análise, tivemos em mente as limitações gerais de usar o Twitter para falar sobre o que o público pensa, faz ou valoriza. Ao contrário das pesquisas por telefone representativas que realizamos, as do Twitter sãonãorepresentativa da população como um todo. No geral, nossas pesquisas mostram que cerca de 23% dos adultos online estão no Twitter e que aqueles que recebem notícias do site são mais jovens, têm mais educação e têm maior probabilidade de possuir um smartphone do que a população em geral.

Como fizemos a análise:

A primeira tarefa ao criar uma amostra de tweets para cada cidade era encontrar uma maneira confiável de gerar limites geográficos para os tweets das cidades-alvo.

Isso se mostrou desafiador, pois olhar para geotags ou localizações autoidentificadas de usuários do Twitter - as soluções aparentemente óbvias - não eram respostas viáveis. No Twitter, os usuários devem optar por ter seus tweets marcados automaticamente com um local, e muito poucos o fazem; a maioria das estimativas é de que apenas cerca de 2% dos tweets possuem geotags. Isso também se provou verdadeiro neste estudo: nas três cidades estudadas em um período de campo de uma semana, quase não havia tweets com geo-tags.

Em seguida, analisamos a localização autoidentificada dos usuários do Twitter com base em seu perfil do Twitter. Examinamos uma amostra de tweets em cada cidade e descobrimos que a maioria dos usuários não preenchia essas informações ou as preenchia com informações que não eram úteis. Por exemplo, 'a lua' e 'espaço sideral' eram locais extremamente populares. Mesmo nos casos em que havia um local utilizável, não havia uma maneira direta de verificar se os usuários realmente moravam onde disseram que moravam.

Em vez disso, recorremos a uma técnica chamada amostragem de 'bola de neve' ou 'cadeia'.

The Twitter HaystackComo já havíamos coletado os identificadores do Twitter de provedores de notícias em cada cidade, retiramos dessa lista inicial de todos os tweets qualquer identificador do Twitter, ou usuário, que @ mencionou ou retuitou o identificador de um provedor de notícias durante o período estudado. Fizemos isso porque mencionar ou retuitar uma notícia indica que o usuário do Twitter está engajado com ela, seja como consumidor de notícias ou como alguém que deseja divulgar a notícia. Embora estivéssemos cientes, não podíamos garantir quetodosUma das novas alças seria conectada diretamente a cada comunidade, nos deu um ponto de partida para refinar ainda mais a amostra.

Essa etapa aumentou o número total de usuários do Twitter na amostra de várias centenas para mais de 30.000. Por fim, os pesquisadores retiraram todos os tweets de cada alça que foram identificados como um provedor de notícias ou um consumidor de notícias durante o período de tempo para cada cidade. Isso resultou em mais de 4,7 milhões de tweets.

Em seguida, reduzimos ainda mais essa amostra de 4,7 milhões para encontrar tweets relevantes para o foco do estudo sobre notícias locais no Twitter - um passo importante porque descobrimos que a grande maioria do conteúdo do Twitter durante a semana estudada não era de natureza local.

Tentamos refinar a amostra estudando os URLs compartilhados no Twitter em cada cidade e observando as palavras-chave. Aproximadamente 40% dos tweets incluíam um URL ou link para outra página da web. Os pesquisadores criaram um programa que iria para cada página da web e verificaria palavras-chave que associariam a página a cada cidade. Usando Macon como caso de teste, criamos uma lista de palavras-chave com base na área estatística metropolitana de Macon (MSA). As 26 palavras-chave incluíram todos os nomes de condados e cidades incluídos no MSA de Macon. Na prática, essas palavras-chave não funcionaram. Mesmo essas palavras-chave, que eram específicas para a área geográfica, eram gerais demais para serem úteis.

Mesmo que esse método tivesse funcionado, ainda havia o problema dos 60% dos tweets que não continham um URL. O fracasso da estratégia de palavras-chave e a emissão de 60% de tweets adicionais nos levaram ao método final que usamos para o estudo.

O que funcionou:

No final, a solução foi uma ferramenta de análise de mídia social chamada Crimson Hexagon, que analisou toda a nossa amostra de tweets para as palavras-chave e hashtags mais comuns. O Crimson Hexagon é um software que pode ser usado para analisar grandes volumes de tweets e extrair várias informações. Nesse caso, usamos a ferramenta para remover tweets irrelevantes para nossa pesquisa. Isso incluía tweets enviados de países fora dos EUA e tweets que não estavam em inglês.

Após removê-los, usamos Crimson Hexagon para encontrar as palavras e frases usadas com mais frequência no conteúdo dos tweets. Isso nos revelou que o conteúdo de notícias locais no Twitter é muito superado por notícias nacionais e outros conteúdos. Palavras-chave sobre notícias locais eram virtualmente impossíveis de encontrar com qualquer frequência.

Apesar da utilidade de ferramentas como Crimson Hexagon, no final encontramos o maior sucesso com uma ferramenta muito menos técnica: humanos. Nós simplesmente lemos tweets - dezenas de milhares deles - para encontrar notícias locais. Esse processo também nos permitiu entender melhor onde as notícias locais apareciam e como estavam sendo compartilhadas.

Combinado com uma análise de conteúdo de fontes de notícias locais, nossas descobertas mostraram que mesmo as poucas notícias locais que estavam sendo compartilhadas no Twitter eram muitas vezes diferentes do que estava sendo coberto pelos veículos de notícias em cada cidade. Por exemplo, em Macon, a história mais compartilhada no Twitter, de longe, era sobre uma banda local que havia entrado em um concurso no VH1. Esta história quase não foi coberta pela grande imprensa durante a semana estudada.

Existem mais ferramentas técnicas disponíveis para mapear grandes tendências no Twitter, como o monitoramento de uma hashtag global. Mas, para nossos objetivos, examinar notícias em comunidades menores, os dados do Twitter eram tão esparsos que não eram tão úteis quanto esperávamos.

Facebook   twitter