Raspagem e Mineração de Dados para Jornalistas

18 agosto, 2016

Novo curso online de jornalismo de dados em português ensina a automatizar coleta de dados da web

This post is also available in: Inglês Espanhol Português

A etapa mais penosa do jornalismo de dados costuma ser a de coleta, especialmente quando o jornalista precisa estruturar planilhas a partir de relatórios PDF, páginas da internet ou redes sociais. O novo curso online em português oferecido pelo Centro Knight e pela Escola de Dados vai mostrar como contornar esse problema e automatizar a coleta de dados da web.

O curso “Raspagem e Mineração de Dados para Jornalistas” será ministrado de 5 de setembro a 2 de outubro por Marco Túlio Pires, coordenador global da rede Escola de Dados, no JournalismCourses.org, o programa de ensino à distância do Centro Knight para o Jornalismo nas Américas da Universidade do Texas em Austin.

Trata-se de um BOC (big online course), uma modalidade de cursos na internet lançada no ano passado pelo Centro Knight que cria oportunidades de treinamento mais avançado e mais especializado que os MOOCs (cursos massivos). Ao contrário dos MOOCs, que geralmente têm milhares de alunos e são grátis, os BOCs têm número limitado de alunos e um custo. Este BOC tem uma taxa de inscrição de 95 dólares, que deve ser paga com cartão de crédito. As vagas são, portanto, limitadas e a inscrição pode ser feita neste link.

Raspagem e Mineração de Dados para Jornalistas
Raspagem e Mineração de Dados para Jornalistas

“A raspagem é importante porque dá ao jornalista a condição de organizar suas próprias bases de dados, a partir de informações que antes não eram reunidas de forma estruturada”, explica Pires. “É possível automatizar a coleta de dados na web, em documentos de texto e até fotos: ou seja, tarefas que antes levariam semanas ou meses para serem finalizadas por uma força-tarefa, com raspagem e programação podem ser realizadas em instantes.”

Os participantes devem ter alguma experiência prévia com estrutura de páginas web, formatos comuns como o CSV e o XLS, noções básicas de jornalismo de dados, mas não precisam ter feito o curso introdutório do Centro Knight “Técnicas Básicas do Jornalismo de Dados”. Todos os estudantes terão acesso gratuito aos recursos do curso massivo para conhecer ou recordar os fundamentos do jornalismo de dados.

Este BOC estará dividido em módulos semanais que incluem materiais multimídia, questionários e fóruns de discussão. Cada semana trará um enfoque diferente: raspagem de redes sociais, de arquivos PDF, de páginas da Web e raspagem com programação de computadores, usando a linguagem Python. Os participantes aprenderão os principais fundamentos de raspagem de dados no contexto do jornalismo com exemplos e atividades práticas.

A maioria das atividades do curso podem ser realizadas em dias e horários escolhidos pelos estudantes. Contudo, há prazos sugeridos para cada semana. A taxa para participar do curso inclui o direito a um certificado eletrônico de conclusão estará disponível para os estudantes que completarem com êxito o curso. Contudo, este certificado não conta como crédito acadêmico.

O BOC de raspagem de dados é um aprofundamento do curso online massivo e aberto (MOOC na sigla em inglês) sobre jornalismo de dados oferecido pelo Centro Knight em 2015, durante cinco semanas. A raspagem de dados foi tratada no segundo módulo e, agora, participantes terão uma oportunidade para se aprimorarem nessa área específica. O MOOC de jornalismo de dados chegou a mais de 5000 pessoas de 92 países. É a primeira vez que o Centro Knight oferece um curso de nível intermediário sobre este tema.

Marco Túlio Pires é jornalista e programador, foi associate-fellow do Knight-Wallace Fellowship, onde estudou Visualização de Dados e Estatística na Escola de Informação da Universidade de Michigan. Também estudou coordenação de projetos e negócios sociais na Escola de Negócios da Universidade Georgetown, no programa Global Competitiveness Leadership. Trabalhou como produtor e coordenador de telejornais na TV Globo, repórter de ciência de VEJA e assessor técnico de gabinete na Secretaria de Desenvolvimento Social do governo de São Paulo, responsável pelas áreas de Inovação, Tecnologia e Transparência. Atualmente é coordenador global da School of Data e um dos fundadores da agência de jornalismo de dados Jornalismo++.

“Estamos felizes com esta parceria com a Escola de Dados Brasil para levar aos jornalistas brasileiros um curso tão prático e tão útil, que resolve problemas específicos enfrentados no dia-a-dia de repórteres que estão se especializando no jornalismo de dados”, disse o professor Rosental Alves, fundador e diretor do Centro Knight da Universidade do Texas em Austin. “Estamos rodeados de grandes volumes de dados, e os jornalistas e os meios têm lutado para buscá-los e apresentá-los da melhor e mais eficaz maneira possível”.

“O jornalismo de dados não é um luxo, nem um gênero de reportagem para as redações mais sofisticadas e caras do mundo. Trata-se de uma série de técnicas e metodologias de trabalho de apuração jornalística indispensável em qualquer redação hoje em dia”, disse o professor Rosental Alves.

Escola de Dados é uma rede de organizações sem fins lucrativos que opera em 13 países e existe no Brasil desde 2013. Seu principal foco é auxiliar ativistas e jornalistas a entenderem o mundo dos dados de forma para que eles possam ter o maior impacto possível em suas atividades profissionais. A Escola também organiza um Fellowship Global, identificando e treinando lideranças locais para elevar o nível de letramento de dados em diversas partes do mundo.

O Centro Knight para o Jornalismo nas Américas foi criado em 2002 pelo professor Rosental Calmon Alves, titular da Cátedra Knight de Jornalismo e da Cátedra UNESCO de Comunicação na Escola de Jornalismo da Universidade do Texas, em Austin. O programa de ensino à distância do Centro Knight ´é mantido graças ao apoio da John S. & James L. Knight Foundation, do Moody College of Communication da Universidade do Texas em Austin e de outros doadores, além da renda obtida com taxas de inscrição e de emissão de certificados. Desde 2012, os MOOCs e outros cursos online de jornalismo do Centro Knight já chegaram a mais de 70 mil pessoas de 169 países.