Capturando dados abertos sem dor de cabeça
Instrutor: Álvaro Justen (Turicas)

Dia e Hora: 23 Junho, 8h
Local: Lab 601 DCM - USP

Obs: Computadores não serão disponibilizados para a realização do tutorial, mas fique a vontade para levar o seu =)

Obs 2: Para acompanhar bem o tutorial é necessário ter um bom conhecimento em Python

Descrição:
Desde a criação de Lei de Acesso à Informação (LAI[1]) vários órgãos
públicos estão disponibilizando dados que antes não tínhamos acesso,
porém nem sempre os dados estão facilmente acessíveis: são públicos,
mas estão disponíveis em formatos não próprios para fazer análises,
muitas vezes contendo erros de formatação e falta de metadados. Quanto
menos acessível um dado está, apesar de público, mais perto de um dado
fechado ele está.
Nesse tutorial Turicas apresentará diversas bases de dados abertas com
as quais já trabalhou, os problemas que enfrentou e
técnicas/metodologias para facilitar o uso desses dados, para que você
não perca tempo das próximas vezes. Também serão mostrados exemplos de
resultados (e código!) desse trabalho de jornalismo de dados no
projeto Gênero e Número, em que analisamos as questões de gênero no
Brasil (e para isso precisamos acessar as mais distintas bases de
dados públicas: algumas disponíveis apenas em tabelas HTML, outras em
CSVs de gigabytes de tamanho ou mesmo em formatos não padronizados).
Ao final, discutiremos como desenvolvedores podem colaborar entre si
na utilização de dados abertos mais acessíveis, para evitar retrabalho
de captura, limpeza e conversão de dados.

[1]: http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm

# Requisitos

- Python 3
- Virtualenv com os seguintes pacotes instalados: rows rows[html] rows[detect]

Nome
Your answer
Email
Your answer
Cidade
Your answer
Você participará do Caipyra?
Submit
Never submit passwords through Google Forms.
This content is neither created nor endorsed by Google. Report Abuse - Terms of Service - Additional Terms