O próximo Hackday acontece já no dia 11 de outubro. Vai ser um dia dedicado à Central de Dados, sobre o mote Datasets, vamos apanhá-los todos.
O que é esse tal de dataset?
Um dataset é um conjunto de dados. Sobre o que são esses dados e com que estrutura estão organizados já são questões mais específicas, importantes mas fora da definição geral do termo.
Imagina uma folha de cálculo com a tua colecção de livros: cada livro está numa linha e cada detalhe numa coluna, uma para o título, outra para o autor, editora, data da edição, número de ISBN, se está contigo ou emprestado a um amigo... Voilá, essa folha de cálculo é um dataset dos teus livros!
Outro exemplo é este dataset de resultados das eleições autárquicas, disponibilizado pela Comissão Nacional de Eleições (CNE) e publicado na Central de Dados no formato data package, organizado por eleição.
No Hackday vamos organizar-nos na busca de datasets como este último exemplo, com informação pública e aberta. A caça aos datasets vai servir para popular a nossa querida Central de Dados.
Aparece e vem aprender mais sobre datasets, open data, e refinamento de dados.
Pois é, depois de encontrar um dataset há que prepará-lo para publicar na Central. Isso inclui polir os dados — para esta tarefas temos várias escolhas, desde o poderoso Open Refine ou magia da linha de comandos com o CSVkit! — e documentar os conteúdos e estrutura do dataset, segundo o formato standard da Open Knowledege para datasets, o data package. Este é o nosso novo amor, o formato de publicação de datasets mais interessante que já encontrámos. Para quem quiser conhecer melhor esta novidade (e o nosso novo projeto, a Central de Dados), é aparecer :-)
Anda daí! Traz portátil, energia, dúvidas e lanche para saborear no jardim.
11 de outubro, no Pavilhão-Jardim do Pólo de Indústrias Criativas (PINC/UPTEC), no horário habitual: 11:00—13:00 + 14:30—17:30.
Cartaz pelas mãos engenhosas de Mariana Magalhães Mota.