A arte e a ciência do gráfico de dispersão

63% dos adultos americanos podem ler este gráfico corretamenteALERTA DE SPOILER:Se você ainda não fez nosso Questionário de Conhecimento de Ciências, faça-o antes de continuar a ler, porque fornecemos uma das respostas.

Em uma pesquisa recente sobre o que os americanos sabem sobre ciência, pedimos às pessoas que interpretassem o gráfico que você vê aqui e nos contassem o que ele mostrava. Seis em dez (63%) identificam a melhor interpretação deste gráfico como 'quanto mais açúcar as pessoas comem, maior é a probabilidade de terem cáries'.

Esse tipo de gráfico - conhecido como gráfico de dispersão - é muito conhecido por pessoas acostumadas a trabalhar com números, como economistas, cientistas, pesquisadores e jornalistas de dados. É uma boa maneira de mostrar uma relação entre duas variáveis.

Talvez sem surpresa, as pessoas que pesquisamos com maior probabilidade de interpretar nosso exemplo de gráfico de dispersão corretamente eram as que tinham educação universitária. Cerca de oito em cada dez (79%) das pessoas com diploma universitário e 84% das pessoas com pós-graduação escolheram a resposta certa entre quatro opções. Em contraste, apenas metade daqueles com ensino médio ou menos chegaram à conclusão correta. A lacuna de educação na questão do gráfico de dispersão perdia apenas para a questão que perguntamos sobre qual propriedade determina o volume do som.

Então, por que o gráfico de dispersão é difícil de ler para pessoas com menos educação? Perguntei a Alberto Cairo, que detém a Cátedra Knight em Jornalismo Visual na Universidade de Miami e é autor de 'The Functional Art'. (Ele tem outro livro, “The Truthful Art”, que sairá no próximo ano.)

'Esquecemos que não apenas entendemos os gráficos automaticamente', disse Cairo. “O gráfico de barras, o gráfico de linhas, somos ensinados a ler isso na escola. Somos ensinados a entender os gráficos '. E na maioria dos casos, incluindo o próprio Cairo, os alunos não são expostos ao gráfico de dispersão na escola primária. São principalmente os alunos que fazem um curso de economia, estatística ou algum outro campo científico que são expostos à análise de relacionamento que o gráfico de dispersão ilustra.



Entre os jornalistas de dados, diz Cairo, há um pensamento comum hoje em dia de que os gráficos devem ser compreendidos instantaneamente. Mas ele discorda '. Isso é completamente falso ', disse ele. 'As visualizações devem ser lidas. Eles são como um pedaço de texto. A primeira vez que vi um gráfico de dispersão, muitos anos atrás, fiquei pasmo. Eu pensei, o que éesta?Passei cinco minutos com ele '.

Mas depois de ler um, você sabe como ler outro. É uma questão de exposição, diz ele. O fato de que cerca de seis em cada dez adultos em nossa pesquisa foram capazes de ler um gráfico de dispersão, portanto, foiBoanotícias, disse ele, porque é surpreendentemente maior do que ele teria pensado.

'Os gráficos têm gramática. Eles têm vocabulário ', disse ele. 'Os resultados significam que estamos expandindo nossa educação. Estamos expandindo nosso vocabulário '.

O gráfico de dispersão se tornou mais popular nos últimos anos, passando de livros e artigos acadêmicos para um uso mais comum em jornais e mídia online. Entre os designers gráficos, é um gráfico mais sofisticado - um passo acima do gráfico típico de barras, linhas ou setores.

Mas issofazreserve um pouco mais de tempo para ler. Em primeiro lugar, não é uma comparação simples de apenas dois elementos, como você encontraria em um gráfico de barras, ou números ao longo do tempo, como em um gráfico de linha. O gráfico de dispersão representa duas variáveis ​​em relação uma à outra.

Um ponto importante a entender é que o gráfico de dispersão mostra correlação, não causalidade, disse a diretora de arte do Pew Research Center, Diana Yoo. O gráfico que usamos foi adaptado de um teste de amostra do Programa de Avaliação Internacional de Alunos da OCDE, aplicado a jovens de 15 anos em mais de 70 países. Embora às vezes as pessoas vejam uma relação causal, o gráfico mostra apenas uma associação entre o consumo médio de açúcar e o número médio de dentes cariados.

Freqüentemente, um gráfico de dispersão inclui uma linha, conhecida como 'linha de melhor ajuste', que ajuda a resumir a relação subjacente entre duas variáveis. A inclinação desta linha pode ajudar a ilustrar se um aumento ou diminuição em uma variável está associado a um aumento ou diminuição na segunda. Em nosso exemplo, o gráfico de dispersão da cárie dentária mostra uma relação positiva. (Um negativo seria inclinado da esquerda para a direita.) Você pode ver a força da relação entre duas variáveis ​​pela proximidade dos pontos de dados em torno da linha de melhor ajuste: quanto mais pontos de dados na linha de melhor ajuste ou próximos a ela ajuste, mais forte será a correlação geral.

No Pew Research Center, publicamos muitos dados em gráficos de dispersão e os consideramos especialmente úteis quando temos um grande número de pontos de dados para mostrar, como a parcela de eleitores hispânicos qualificados em cada distrito congressional, ou países, como riqueza em relação à disponibilidade de alimentos ou mesmo para pintar um quadro de quem está tendo um 'bom' dia.

É seguro dizer que a maioria dos jornalistas de dados são fãs de scatterplot. Mas o que vem a seguir? Cairo diz que o vocabulário gráfico do país pode se expandir ainda mais. Ecoando a jornalista do New York Times Amanda Cox, ele disse que o próximo gráfico em alta é o histograma. O que é isso? Veja um dos nossos e diga-nos se você também pode lê-lo.

Facebook   twitter