Preparar a Hackathon (Skype)

por camorim

Ontem, realizou-se uma conversa via skype  com o Vítor, Victor e Cláudia para alinhavar algumas ideias relativamente ao que se pode fazer na Hackathon de 4 e 5 de Dezembro.
Focámo-nos em alguns pontos que podem ser objecto de atenção na maratona. Achámos que não existem tarefas que possam ser realizadas integralmente no período dos dois dias. Ficámos mais por compilação e preparação de fases seguintes.

Possíveis to-dos
1. ANÁLISE DE DADOS - Estudar a ferramenta usada pelo OpenParliament (Canadá) disponível no GitHub do responsável para ensaiar algo com o dataset do DAR já criado. A tecnologia usada foi Django e Python.

2. DEPURAR DADOS - Ponderar o interesse em aplicar o Google refine para detectar bugs nos ficheiros DAR e caso seja desajustado, estabelecer uma task force e metodologia para fazer essa revisão de forma mais ou menos sistemática e profunda.

3. COMPILAÇÃO DE INFORMAÇÃO - Esta é uma tarefa pouco animadora, mas necessária para o trabalho poder avançar no futuro. Existem certamente muitos elementos informativos que é necessário reunir para uma análise consistente, mas considerámos os seguintes:

3.1. Dar continuidade à lista de organismos públicos que começou a ser criada. Essa tabela já existe, tem vários campos, mas não contemplava o da morada da entidade. Convém incluir para começar a fazer mapas geográficos. Na maratona pode pôr-se no Gitorious. O Google refine também gera coordenadas a partir de campos de moradas, podendo vir a ser uma boa forma de automatizar o processo.

3.2. Dar início à referenciação de Datasets públicos de Portugal (Parlamento, CNE, Base, Pordata...)

3.3. Completar lista do social dos deputados: twitter..., wikipédia

4. SCRAPPING DE DADOS - Extrair do Parlamento (Biografias deputados) as listas de interesses, umas em pdf outras em HTML, onde se registam nomes de empresas que podem ser usadas numa outra lista (Nome, morada, deputados com ligações).

5. DOCUMENTAÇÃO DO PROJECTO - Estabelecer uma estrutura mais rica na wiki do projecto. Partindo do que já existe, tentar organizar melhor:
Proposta para  a página de entrada Transparência Hackday Porto:

  • Seguir e contactar: mailing, irc, blog, wiki...
  • Glossário: o que é api, scrapping... e outros termos na perspectiva do projecto
  • Gráficos: "bonecos", diagramas a explicar o que se pretende
  • Apresentação: descrição (ok), objectivos (ok)
  • Equipa
  • Lista de: done, to do, wish list
  • Registos (work in progress): seccionar os trabalhos/ núcleos, dando os seguintes elementos: descrição do que se pretende, fontes/datasets usados, tratamento dado, ferramentas usadas, dificuldades encontradas, resultados obtidos, cronograma. Ex. Núcleo do scrapping, no quals e deve explicar a estrutura dos dados capturados, a forma de armazenamento e porquê, as ferramentas usadas para a recolha, como se lidará com a actualização, etc...
  • Documentação de apoio (projectos externos). Nota: Já está a ser criada esta secção.

6. SOLICITAR COLABORAÇÃO EXTERNA - Este contacto com várias comunidades pode ser um momento oportuno para pedir colaboração de terceiros para fornecerem informação das listagens e tabelas de recolha de informação em curso, e de fontes importantes de datasets públicos de que tenha, conhecimento.

Quero ir!

Os nossos encontros são marcados ao segundo sábado de cada mês, no CRU Cowork.

Das 10:00 às 17:00, com pausa para almoço entre às 13:00 e as 14:00!

Temos internet, projetor, whiteboards e alguns comes e bebes. Traz o teu portátil e outros acessórios que possam dar jeito para hackarmos em conjunto.

Onde

CRU Cowork
Rua do Rosário 211
4050-524 Porto

Segue-nos para ficares a par das novidades:

Organização

Transparência Hackday Portugal
Open Knowledge Portugal

Apoio

UPTEC