• Principal
  • Notícia
  • Perguntas e respostas: usando dados de pesquisa do Google para estudar o interesse público na crise da água em Flint

Perguntas e respostas: usando dados de pesquisa do Google para estudar o interesse público na crise da água em Flint

Como os americanos usaram o Google para aprender sobre a crise de contaminação da água em Flint, Michigan, e como suas pesquisas online evoluíram com o tempo? Essas questões estão no centro de um novo estudo do Pew Research Center que analisa 18 meses de dados de pesquisa do Google para rastrear o interesse público na crise de várias camadas em Flint.

Embora o estudo se concentre em um evento de notícias específico, ele lança luz sobre questões de pesquisa mais amplas, principalmente o que as consultas de pesquisa agregadas da Internet podem nos dizer sobre como as notícias se espalham no ambiente de notícias digitais de hoje. Amy Mitchell, diretora de pesquisa em jornalismo do Pew Research Center, ajudou a redigir o estudo; o que se segue é uma entrevista editada com Mitchell sobre a metodologia do relatório.

Por que você se concentrou na crise da água em Flint?

Embora nossos interesses de pesquisa sejam amplos, achamos que o uso de um estudo de caso nos permitiria examinar profundamente as nuances do interesse público em um tópico de notícias à medida que a história se desenrola. Queríamos uma história com muitas palavras-chave exclusivas de pesquisa na Internet, bem como uma área geográfica precisa, ambas as quais tendem a permitir um rastreamento mais preciso da atividade de pesquisa na Internet. Também esperávamos ter uma notícia com a qual as pessoas pudessem se conectar em vários níveis. O caso Flint atende a esses critérios. Existem muitas palavras-chave de pesquisa específicas para a crise de Flint. Também teve uma linha de tempo longa, evoluiu de uma questão local para uma nacional e tornou-se uma história com impacto nos níveis pessoal, comunitário e político.

Este relatório é diferente de muitas análises do Pew Research Center, pois não usa dados de pesquisa. Como este relatório foi feito?

No Pew Research Center, empregamos muitas metodologias em nossa pesquisa, dependendo das perguntas que estamos tentando responder. Essas metodologias incluem análises originais de grandes conjuntos de dados externos, que é o que fizemos aqui. Este foi nosso primeiro uso de dados da API do Google Health, que é essencialmente um ponto de acesso para analisar grandes quantidades de dados sobre os termos que os usuários da Internet pesquisaram durante um determinado período.

Nossa equipe passou vários meses certificando-se de que entendíamos totalmente os dados, como eles são organizados e os melhores métodos para obter retornos de dados precisos antes de embarcarmos no próprio estudo Flint. Assim que nos sentimos confiantes nos métodos, a equipe extraiu os resultados das consultas ao longo das 130 semanas deste estudo, realizou uma série de etapas estatísticas para limpar o conjunto de dados e, em seguida, iniciou nossas análises internas.

Por que você usou os dados de pesquisa do Google, especificamente?

Embora nenhum mecanismo de pesquisa possa representar as consultas de todos os americanos, a grande maioria dos pesquisadores online usa o Google, e vários pesquisadores estão experimentando seu uso como uma ferramenta para compreender as atitudes e comportamentos do público. Para este projeto, nos inscrevemos no Google e recebemos acesso à API privada do Google Health, que fornece dados mais granulares do que o site público do Google Trends.



O que você pode aprender com esse tipo de dados de pesquisa? Os dados de pesquisa podem fornecer uma amostra representativa de alguma população?

A forma como os dados são retornados não é no nível do usuário, mas no nível da consulta de pesquisa individual. Em outras palavras, a unidade de análise são as pesquisas, não as pessoas. É importante lembrar que os dados são mostrados como uma proporção de todas as pesquisas na área geográfica para aquele período de tempo, não o volume total. Então, por exemplo, quando falamos sobre aumentos na atividade de pesquisa de termos pessoais relacionados à saúde em Michigan, isso significa que as pesquisas por esses itens foram uma porção maior detodospesquisas no estado de Michigan naquela semana, em comparação com a semana anterior.

Que desafios você encontrou ao usar dados de pesquisa?

Como acontece com qualquer nova fonte de dados ou ferramenta, vários desafios surgiram conforme trabalhávamos para entender completamente o que os dados representam, o que eles não representam e como melhor estruturar uma análise precisa. Muitos dos desafios são discutidos em detalhes na metodologia, então vou apenas destacar um exemplo aqui.

Para qualquer consulta, a API do Google Health obtém uma amostra de pesquisas. Os resultados podem variar bastante de consulta para consulta, com base na amostra obtida. Para lidar com essa variação, extraímos 50 amostras para cada categoria de pesquisa em cada área geográfica para cada semana ao longo dos 2 anos e meio estudados, resultando em um total de 91.000 amostras. Então, para cada semana, tiramos a média das 50 amostras.

Outro aspecto deste relatório envolveu o rastreamento da cobertura de notícias relacionadas à crise de Flint. Como você fez isso?

O objetivo desta parte do projeto era capturar um amplo volume de cobertura da mídia ao longo do tempo; não era para conduzir uma análise detalhada do conteúdo da mídia. Para fazer isso, coletamos notícias de uma amostra da mídia local, regional e nacional para o mesmo intervalo de tempo que os dados de pesquisa do Google. Incluímos tudo o que poderia ser identificado como sendo sobre a crise de água de Flint. A identificação foi um processo de duas etapas: primeiro, as buscas por palavras-chave foram usadas para identificar e capturar todas as histórias relacionadas possíveis. Em seguida, uma equipe de programadores leu ou assistiu a cada história para verificar se pelo menos 50% era sobre a crise da água em Flint.

Este projeto contém alguma lição ou advertência para outros pesquisadores que podem querer usar dados de pesquisa para avaliar o interesse dos americanos em eventos de notícias?

Absolutamente. Escrevemos sobre vários deles em uma postagem no Medium, mas alguns pontos-chave para manter em mente são que o Google Trends mede a atividade de pesquisa, não a opinião ou a prioridade. Embora a atividade de pesquisa muitas vezes possa ser vinculada a interesses, ela não indica opiniões positivas ou negativas por parte do público, ou que um termo de pesquisa que retorna mais resultados é mais importante do que outro termo. Além disso, nas pesquisas por palavra-chave, os termos devem ser exatos, o que significa que cada conjugação de uma palavra ou combinação de palavras deve ser inserida separadamente. Por exemplo, se alguém quiser ver a atividade de pesquisa em torno de 'teste de chumbo', você precisa inserir 'testes de chumbo', 'teste de chumbo', 'teste de chumbo' e 'teste de chumbo'. Para nós, isso significava usar quase 2.700 termos de pesquisa diferentes.

Facebook   twitter