Introdução ao jornalismo de dados:

Como entrevistar dados para reportagens investigativas


Instrutores: Natália Mazotte, Adriano Belisário, Álvaro Justen e
Rodrigo Menegat





Esta página de recursos apresenta conteúdo do MOOC “Introdução ao jornalismo de dados: Como entrevistar dados para reportagens investigativas”, realizado pelo Centro Knight para o Jornalismo nas Américas. Este curso massivo em português de cinco semanas aconteceu 5 de agosto - 8 de setembro de 2019. Agora, disponibilizamos o conteúdo gratuitamente para os alunos que fizeram o curso e para qualquer pessoa interessada em aprender sobre os conceitos básicos de Jornalismo de Dados.


O curso foi ministrado por quatro reconhecidos profissionais: Natália Mazotte, Adriano Belisário, Álvaro Justen e Rodrigo Menegat. O conteúdo do curso inclui aulas em vídeo e tutoriais, leituras, exercícios e muito mais.


Os materiais estão divididos em cinco módulos:

  • Módulo 1: O que é jornalismo de dados, o que impulsionou sua expansão, exemplos inspiradores e perguntas cruciais para um jornalista de dados fazer antes de chegar a conclusões para suas histórias.
  • Módulo 2: Os vídeos e textos obrigatórios realizam um percurso que vai desde conceitos básicos sobre ‘dados abertos’ e análise à utilização de editores de planilha para entrevistar seus dados e descobrir informações relevantes.
  • Módulo 3: vamos olhar para os problemas mais comuns que enfrentamos na rotina de trabalhar com dados.
  • Módulo 4: Vamos aprender a transformar todas as coisas que descobrimos sobre uma base dados em gráficos efetivos e atraentes.
  • Módulo 5: A aprender SQL, uma linguagem de comunicação com sistemas de bases de dados.

Ao revisar esta página de recursos, incentivamos você a assistir aos vídeos, ler as leituras e concluir os exercícios conforme o seu tempo permitir. Os materiais do curso se complementam, mas os vídeos e as leituras também funcionam como recursos autônomos que podem ser consultados de acordo com a necessidade de cada um.


Esperamos que você aproveite os materiais e os compartilhe com outras pessoas interessadas em aprender a trabalhar com dados e pesquisas eleitorais. Se você tiver alguma dúvida, entre em contato conosco pelo e-mail JournalismCourses@austin.utexas.edu.



SOBRE OS INSTRUTORES



Natália Mazotte é diretora-executiva da Open Knowledge Brasil, onde lidera projetos de inovação cívica e capacitação em uso de dados. Co-fundou a Gênero e Número, startup de jornalismo de dados com foco em gênero, e criou a primeira conferência brasileira de jornalismo de dados e métodos digitais (Coda.Br). Trabalhou com estratégia digital em organizações como Ibase, Globo e Ministério Público do Rio de Janeiro. É professora na pós-graduação em Jornalismo Digital da PUC-RS e no MBA Web Intelligence e Digital Ambience da COPPE/UFRJ e instrutora em cursos massivos do Centro Knight, da Universidade do Texas. Possui mestrado em Comunicação pela UFRJ e pós-graduação em Estratégia Digital pela Universidade Pompeu Fabra (Espanha) e recebeu em 2019 a bolsa JSK da Universidade de Stanford.



Adriano Belisário é jornalista e atua com investigações baseadas em dados desde 2012. Atualmente, coordena a Escola de Dados e atua em projetos de produção de evidências com dados e fontes abertas. Há mais 10 anos colabora com redes e projetos de produção de mídia com softwares livres, implementando programas no âmbito do Ministério da Cultura, da Secretaria de Estado de Cultura e da Universidade Federal do Rio de Janeiro, onde fez mestrado em Comunicação Social.



Álvaro Justen é programador e professor. Ativista de software livre desde 2004 e programador Python desde 2005, atualmente trabalha capturando, convertendo, limpando e analisando dados em diversos projetos jornalísticos e de inovação cívica brasileiros; é fundador do portal de dados abertos acessíveis Brasil.IO e quando não está programando, dá aulas, viaja a congressos, prova e torra cafés especiais.



Rodrigo Menegat trabalho como jornalista na editoria de infografia digital do Estadão, onde produz reportagens e visualizações feitas a partir da exploração de bases de dados. Antes disso, trabalhou como redator e repórter na Folha de S.Paulo e teve conteúdo publicado em veículos como The Intercept e Agência Pública. É formado em jornalismo pela Universidade Estadual de Ponta Grossa, no Paraná, e fez uma especialização em jornalismo de dados na Universidade de Columbia, em Nova York.





Admirável mundo novo do jornalismo de dados


Ao final da primeira semana, você terá aprendido:

  • O que, afinal, é jornalismo de dados?
  • Conceitos fundamentais e fluxo de trabalho com dados
  • Incorporando novas habilidades à rotina jornalística
  • De John Snow ao jornalismo de dados do NYT: exemplos inspiradores e inovadores
  • O que quantificamos? Dados e incerteza
  • Ligando o radar para obter dados
  • Perguntas cruciais para compreender seus dados

Vídeo-Aulas (Obrigatórias)

1. Introdução ao Módulo

2. O que é jornalismo de dados?

3. Fluxo de trabalho com dados

4. Exemplos de Jornalismo de Dados

5. Perguntas cruciais

6. Busca Avançada para obter bases de dados

7. Usando a LAI para obter bases de dados



Leituras (Obrigatórias)

1. Tutorial: Solicitando dados via LAIURL [A Escola de Dados]

2. Tutorial: Busca avançada na web [A Escola de Dados]

3. Dados e incerteza: por que precisamos ser céticos? [Medium]

4. Novas fronteiras do jornalismo de dados no Brasil [Medium]

5. Jornalismo de Dados: Conceitos e categorias [PDF]

6. Importância do jornalismo de dados [PDF]



Materiais de Apoio (Opcionais)

1. Genealogia do Jornalismo de Dados (em inglês)

2. Jornalismo de Dados com Impacto (em inglês)

3. Planilha colaborativa: fontes de dados disponíveis



Analisando os trends na corrida eleitoral


Ao final da segunda semana, você terá aprendido:

  • O que são dados abertos e dados legíveis por máquinas
  • O que é e como abrir um arquivo CSV
  • Quais são os tipos de dados mais comuns e como configurá-los
  • Operações básicas: ordenar e filtrar dados por diferentes critérios
  • Agrupando informações: como usar tabela dinâmica para analisar dados
  • Análise de dados com taxas e medidas de tendência central
  • Como cruzar dados

Vídeo-Aulas (Obrigatórias)

1. Apresentação do módulo

2. O que são dados abertos e dados legíveis por máquinas?

3. O que é e como abrir um arquivo CSV?

4. Quais são os tipos de dados mais comuns e como configurá-los?

5. Operações básicas: ordenar e filtrar dados por diferentes critérios

6. Agrupando informações: como usar tabela dinâmica para analisar dados

7. Outliers e medidas de tendência central

8. Calculando taxas simples

9. Cruzando tabelas



Leituras (Obrigatórias)

1. Introdução à Análise de Dados [A Escola de Dados]

2. Entrevistando Dados: uma introdução prática - parte I [A Escola de Dados]

3. Entrevistando Dados: uma introdução prática - parte II [A Escola de Dados]

4. Análise com estatística descritiva para leigos [A Escola de Dados]

5. Quiz sobre as 5 estrelas dos dados abertos [H5P]



Materiais de Apoio (Opcionais)

1. Slides - Módulo 2

2. "Numbers in the newsroom" - Sarah Cohen (em inglês)

3. O que são dados abertos?



O mundo real dos dados e como lidar com seus problemas


Ao final da terceira semana, você terá aprendido:

  • Como avaliar a qualidade dos dados?
  • Como limpar dados com o Open Refine
  • E quando o dado não está estruturado ou em formato legível por máquina?
  • Como lidar com dados em PDF
  • Como usar o Inspetor Web para fazer um raio-X da estrutura de um site
  • Como raspar dados usando seu navegador (sem programar!)

  • Vídeo-Aulas (Obrigatórias)

    1. Introdução ao Módulo

    2. Checando a qualidade dos dados

    3. Introdução ao Open Refine

    4. Open Refine - parte 1

    5. Open Refine - parte 2

    6. Open Refine - parte 3

    7. Introdução à raspagem de dados

    8. Extraindo dados de PDFs com Tabula

    9. ImportHTML

    10. Slides


    Leituras (Obrigatórias)

    1. Guia Quartz para a Limpeza de Dados [A Escola de Dados]

    2. Tutorial Escola de Dados: Raspagem e Jornalismo de Dados [A Escola de Dados]

    3. Tutorial Escola de Dados: Ferramentas simples e gratuitas de raspagem [A Escola de Dados]

    4. Tutorial da Escola de Dados: Guia para converter PDF em tabelas [A Escola de Dados]

    5. Tutorial Escola de Dados: Libertando dados com Tabula e Rows [A Escola de Dados]

    6. Tutorial Escola de Dados: Usando o Tabula na linha de comando [A Escola de Dados]

    7. Tutorial Escola de Dados: Usando OCR em dados e tabelas de PDFs [A Escola de Dados]


    Materiais de Apoio (Opcionais)

    1. Open Refine: Dowload

    2. Tabula: Dowload

    3. Webscraper: Dowload

    4. Bases de Dados

    5. Open Refine: 'Cluster and Edit' em detalhes

    6. Tutoriais Webscraper



    Visualização: qual é a “cara” dos meus dados?


    Ao final da terceira semana, você terá aprendido:

  • Os princípios teóricos da visualização de dados
  • Como usar a visualização de dados para fazer análise exploratória
  • Quais são os principais tipos de gráfico e quando usar cada um
  • Quais são os erros mais comuns na hora de montar um gráfico
  • Quebrando as regras: inovando no jornalismo visual
  • Como usar algumas ferramentas de visualização online

  • Vídeo-Aulas (Obrigatórias)

    1. O que é visualização de dados?

    2. Legal, mas pra que isso serve?

    3. Como escolho o melhor formato para meu gráfico?

    4. Dá pra fazer um gráfico preciso e atraente ao mesmo tempo?

    5. Mão na massa – 1ª tarefa

    6. Mão na massa – 2ª tarefa

    7. Slides


    Leituras (Obrigatórias)

    1. Introdução à visualização de dados, por Rodrigo Menegat [Rodrigo Menegat]

    2. Erros comuns na visualização, por Kathy Chang, Kate Eyler-werve e Alberto Cairo [Rodrigo Menegat]

    3. Visualização de dados na apuração: análise exploratória [Rodrigo Menegat]

    4. Dez ferramentas para fazer visualização de dados, por Rodrigo Menegat [Rodrigo Menegat]

    5. A vanguarda da visualização de dados no jornalismo, por Rodrigo Menegat [Rodrigo Menegat]


    Materiais de Apoio (Opcionais)

    1. The Functional Art, de Alberto Cairo

    2. The Truthful Art, de Alberto Cairo

    3. The Wall Street Journal Guide To Information Graphics, de Dona M. Wong



    Meu Excel travou, e agora?


    Ao final da terceira semana, você terá aprendido:

  • O que é SQL e como utilizá-la
  • Acessando e filtrando registros de uma tabela
  • Ordenando, limitando e exportando resultados das consultas
  • Criando agrupamentos e otimizando as consultas
  • Cruzando tabelas (JOIN)

  • Vídeo-Aulas (Obrigatórias)

    1. Introdução

    2. Filtrando

    3. Organizando

    4. Agrupando

    5. Cruzando


    Leituras (Obrigatórias)

    1. DB Browser for SQLite [sqlitebrowser.org]

    2. Dados (baixar todos os arquivos) [Google Drive]

    3. Slides Aula 1 [Slides]

    4. Slides Aula 2 [Slides]

    5. Slides Aula 3 [Slides]

    6. Slides Aula 4 [Slides]

    7. Slides Aula 5 [Slides]

    8. Slides (baixar) [Google Drive]


    Materiais de Apoio (Opcionais)

    1. Explicação visual dos tipos de JOIN em SQL (em Inglês)

    2. Documentação do comando EXPLAIN QUERY PLAN (em Inglês)