Jornalismo de dados em perspectiva


Em agosto de 2010, eu e alguns colegas do Centro Europeu de Jornalismo organizamos o que acreditamos ser uma das primeiras conferências internacionais sobre jornalismo de dados, realizada em Amsterdã. Naquele momento, não havia muitas discussões sobre o tema e poucas organizações eram amplamente reconhecidas por trabalhar na área.

Um dos mais importantes passos para dar visibilidade ao termo foi a forma como grupos de mídia como The Guardian e The New York Times lidaram com a imensa quantidade de dados divulgados pelo WikiLeaks. Nesse período, o termo passou a ser usado de maneira mais ampla (ao lado de Reportagem com Auxílio do Computador, ou RAC) para descrever como jornalistas estavam usando dados para melhorar suas reportagens e para aprofundar investigações sobre um tema.

Ao conversar com jornalistas de dados experientes e teóricos do Jornalismo no Twitter, me parece que uma das primeiras definições do que hoje reconhecemos como jornalismo de dados foi feita em 2006, por Adrian Holovaty, fundador do EveryBlock, um serviço de informação que permite ao usuários descobrir o que está acontecendo na sua região, no seu quarteirão. No seu pequeno ensaio “Uma maneira fundamental na qual sites de jornais têm que mudar”, ele defende que jornalistas devem publicar dados estruturados, compreensíveis por máquinas, ao lado do tradicional “grande borrão de texto”:

Por exemplo, digamos que um jornal publicou uma notícia sobre um incêndio próximo. Ler essa história num celular é bacana e elegante. Viva a tecnologia! Mas o que realmente quero é ser capaz de explorar os dados brutos dessa história, um a um, com diferentes camadas. Ter a infraestrutura para comparar detalhes deste incêndio com os detalhes dos anteriores: data, horário, local, vítimas, distância para o quartel do Corpo de Bombeiros, nomes e anos de experiência dos bombeiros que foram ao local, tempo que levaram para chegar, e incêndios subsequentes, quando vierem a ocorrer.

Mas o que torna essa forma peculiar diferente de outros modelos de jornalismo que usam banco de dados ou computadores? Como e em que extensão o jornalismo de dados é diferente das vertentes de jornalismo do passado?

Reportagem com Auxílio do Computador (RAC) e o Jornalismo de Precisão

Há uma longa história de uso de dados para aprofundamento da reportagem e distribuição de informação estruturada (mesmo que não legível por máquinas). Talvez o mais relevante para o que hoje chamamos de jornalismo de dados é a Reportagem com Auxílio do Computador (RAC) que foi a primeira tentativa organizada e sistemática de utilizar computadores para coletar e analisar dados para aprimorar a notícia.

A RAC foi usada pela primeira vez em 1952 pela rede de TV americana CBS, para prever o resultado da eleição presidencial daquele ano. Desde a década de 60, jornalistas (principalmente os investigativos, principalmente nos Estados Unidos) têm analisado bases de dados públicas com métodos científicos para fiscalizar o poder de forma independente. Também chamado de “jornalismo de interesse público”, defensores dessa técnicas baseadas no auxílio do computador têm procurado revelar tendências, contrariar o senso comum e desnudar injustiças perpetradas por autoridades e corporações. Por exemplo, Philip Meyer tentou desmontar a percepção de que apenas os sulistas menos educados participaram do quebra-quebra nas manifestações de 1967 em Detroit. As reportagens da série “A cor do dinheiro”, publicadas nos anos 80 por Bill Dedman, revelaram preconceito racial sistemático nas políticas de empréstimo dos principais bancos. No seu artigo “O que deu errado”, Steve Doig procurou analisar os padrões de destruição do Furacão Andrew no início dos anos 90, para entender as consequências das políticas e práticas falhas de desenvolvimento urbano. Reportagens movidas por dados prestaram valiosos serviços públicos e deram prêmios cobiçados aos autores.

No início dos anos 70, o termo jornalismo de precisão foi cunhado para descrever esse tipo de apuração jornalística: “o emprego de métodos de pesquisa das ciências sociais e comportamentais na prática jornalística” (em The New Precision Journalism de Philip Meyer). O jornalismo de precisão foi proposto para ser praticado nas instituições jornalísticas convencionais por profissionais formados em jornalismo e em ciências sociais. Nasceu como resposta ao “New Journalism”, que aplicava técnicas de ficção à reportagem. Meyer defendia que eram necessários métodos científicos para coleta e análise de dados, em vez de técnicas literárias, para permitir que o jornalismo alcançasse sua busca pela objetividade e verdade.

O jornalismo de precisão pode ser entendido como reação a algumas das inadequações e fraquezas do jornalismo normalmente citadas: dependência dos releases de assessorias (mais tarde descrito como “churnalism” ou “jornalismo de batedeira”), predisposição em acatar as versões oficiais, e por aí vai. Estas são decorrentes, na visão de Meyer, da não aplicação de técnicas e métodos científicos como pesquisas de opinião e consulta a registros públicos. Como feito nos anos 60, o jornalismo de precisão serviu para retratar grupos marginais e suas histórias. De acordo com Meyer:

O jornalismo de precisão foi uma forma de expandir o arsenal de ferramentas do repórter para tornar temas antes inacessíveis, ou parcialmente acessíveis, em objeto de exame minucioso. Foi especialmente eficiente para dar voz à minoria e grupos dissidentes que estavam lutando para se verem representados.

Um artigo influente publicado nos anos 80 sobre a relação entre o jornalismo e as ciências sociais ecoa o discurso atual em torno do jornalismo de dados. Os autores, dois professores de jornalismo americanos, sugerem que nas décadas de 70 e 80, a compreensão do público sobre o que é notícia se amplia de uma concepção mais direta de “fatos noticiosos” para “reportagens de comportamento” (ou reportagens sobre tendências sociais). Por exemplo, ao acessar os bancos de dados do Censo ou de outras pesquisas, os jornalistas conseguem “extrapolar o relato de eventos isolados e oferecer contexto que dá sentido ao fatos específicos”.

Como podíamos esperar, a prática do uso de dados para incrementar a reportagem é tão antiga quanto a própria existência dos dados. Como Simon Rogers aponta, o primeiro exemplo de jornalismo de dados no The Guardian remonta a 1821. Foi uma lista, obtida de fonte não oficial, que relacionava as escolas da cidade de Manchester ao número de alunos e aos custos de cada uma. De acordo com Rogers, a lista ajudou a mostrar o verdadeiro número de alunos que recebiam educação gratuita, muito maior do que os números oficiais revelavam.

Imagem 9. Jornalismo de dados no The Guardian em 1821 (the Guardian)

Outro exemplo seminal na Europa é Florence Nightingale e seu relato fundamental, “Mortalidade no Exército Britânico”, publicado em 1858. No seu relato ao Parlamento inglês, ela usou gráficos para defender o aperfeiçoamento do serviço de saúde do exército britânico. O mais famoso é o seu gráfico crista de galo, uma espiral de seções em que cada uma representa as mortes a cada mês, que destacava que a imensa maioria das mortes foi consequência de doenças preveníveis em vez de tiros.

Imagem 10. Mortalidade do exército britânico por Florence Nightingale (imagem da Wikipedia)

Jornalismo de dados e a Reportagem com Auxílio do Computador

Atualmente há um debate sobre “continuidade e mudança” em torno do rótulo “jornalismo de dados” e sua relação com vertentes jornalísticas anteriores que empregaram técnicas computacionais para analisar conjuntos de dados.

Alguns defendem que há diferença entre RAC e jornalismo de dados. Defendem que RAC é uma técnica para apurar e analisar dados de forma a aprimorar uma reportagem (normalmente investigativa), enquanto o jornalismo de dados se concentra na maneira como os dados permeiam todo o processo de produção jornalístico. Nesse sentido, o jornalismo de dados dedica tanta — às vezes, até mais — atenção aos dados propriamente ditos em vez de apenas empregá-los como forma de descobrir ou melhorar uma reportagem. Por isso, vemos o Datablog do The Guardian e o jornal Texas Tribune publicando conjunto de dados lado a lado com as notícias – ou até mesmo apenas os dados sozinhos — para as pessoas analisarem ou explorá-los.

Outra diferença é que, no passado, jornalistas investigativos enfrentariam escassez de informações em relação a questão que estavam tentando responder ou ponto que buscavam esclarecer. Embora, evidentemente, isso continua a acontecer, há ao mesmo tempo uma abundância de informações que os jornalistas não necessariamente sabem como manipular. Não sabem como extrair valor dos dados. Um exemplo recente é o Combined Online Information System, maior banco de dados de gastos públicos do Reino Unido. Este banco de dados foi por muito tempo cobrado pelos defensores da transparência mas, quando foi lançado, deixou jornalistas perplexos e confusos. Como Philip Meyer escreveu recentemente para mim: “Quando a informação era escassa, a maior parte dos nossos esforços eram dedicados à caça e à obtenção de informação. Agora que é abundante, o processamento dessa informação é mais importante.”

Por outro lado, alguns ponderam que não há diferença significativa entre o jornalismo de dados e a Reportagem com Auxílio do Computador. Já é senso comum que mesmo as mais modernas técnicas jornalísticas tem um histórico e, ao mesmo tempo, algo de novo. Em vez de debater se o jornalismo de dados é uma novidade completa ou não, uma posição mais produtiva seria considerá-lo parte de longa tradição, mas que agora responde a novas circunstâncias e condições. Mesmo que não haja uma diferença entre objetivos e técnicas, o surgimento do termo “jornalismo de dados” no início do século indica nova fase em que o absoluto volume de dados que estão disponíveis online — combinado com sofisticadas ferramentas centradas no usuário, plataformas de crowdsourcing e de publicação automática –permitem que mais pessoas trabalhem com mais dados mais facilmente do que em qualquer momento anterior da história.

Jornalismo de dados significa alfabetização de dados do público

A internet e as tecnologias digitais estão alterando fundamentalmente a forma como a informação é publicada. O jornalismo de dados é uma parte do ecossistema de práticas e ferramentas que surgiram em torno dos serviços e sites de dados. Citar e compartilhar fontes e referências faz parte da natureza da estrutura de links da internet, é a forma como estamos acostumados a navegar pela informação hoje em dia. Voltando um pouco no tempo, o princípio na base da fundação da estrutura de links da web é o mesmo princípio de citação usado nos trabalhos acadêmicos. Citar e compartilhar as fontes e dados por trás da notícia é uma das maneiras mais básicas em que o jornalismo de dados pode aperfeiçoar o jornalismo, aquilo que o fundador da WikiLeaks, Julian Assange, chama de “jornalismo científico”.

Ao permitir que cada um mergulhe com atenção nas fontes de dados e descubra informação relevante para si mesmo, ao mesmo tempo que checa afirmações e desafia suposições comumente aceitas, o jornalismo de dados efetivamente representa a democratização de recursos, ferramentas, técnicas e métodos antes restritos aos especialistas; seja repórteres investigativos, cientistas sociais, estatísticos, analistas ou outros especialistas. Ao mesmo tempo em que citar e oferecer links para as fontes de dados é característica do jornalismo de dados, estamos caminhando para um mundo em que os dados estão perfeitamente integrados ao tecido da mídia. Jornalistas de dados têm papel importante ao ajudar a diminuir as barreiras para compreensão e imersão nos dados, e aumentar a alfabetização de dados dos seus leitores em grande escala.

No momento, a comunidade de pessoas que se auto-denominam jornalistas de dados é bastante diferente da comunidade mais madura da RAC. Tomara que, no futuro, vejamos laços mais fortes entre essas duas comunidades, da mesma forma que vemos novas organizações não governamentais e organizações de mídia cidadã como a ProPublica e o Bureau de Jornalismo Investigativo trabalharem de mãos dadas com redações tradicionais em investigações. Ao mesmo tempo em que a comunidade de jornalismo de dados possa ter formas inovadoras para entregar dados e apresentar notícias, a abordagem profundamente analítica e crítica da comunidade da RAC tem muito a ensinar ao jornalismo de dados.

Liliana Bounegru, Centro Europeu de Jornalismo

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s