Olá Abelardo,
On Tue, 2016-05-10 at 07:47 -0700, Abelardo Mota wrote:
> Fala Marcelo,
>
> parabéns pelos projetos!
> Há alguns anos baixei os dados de candidaturas do TSE e fiz umas
> rápidas análises. Na época ainda estava engatinhando com a área de
> dados, não avancei muito.
> Estou atualmente estudando uma ferramenta de ETL(Pentaho PDI) e
> fiquei curioso sobre como fizeram a parte de extração dos dados e
> integração, e qual a estrutura da base que a API consome. Se tiver
> alguma oportunidade de contribuição na camada de ETL, peço que me
> avise. Atualmente, como caso de estudo, tenho trabalhado com os dados
> de remuneração dos servidores do executivo federal.
A extração é simples, leio cada arquivo CSV do TSE transformando em
objetos do model do Django. Hoje essa importação dos dados é um
gargalo, demora várias horas para processar tudo, mas estou
refatorando.
A base da API é o Django Tastypie [0]. As rotas retornam conteúdo JSON,
como por exemplo a lista de partidos:
http://politicos.olhoneles.org/api/v0/political-parties/
Toda ajuda é bem vinda ;-)
[0]
https://github.com/django-tastypie/django-tastypie
--
Marcelo Jorge Vieira
xmpp:me...@jabber-br.org
http://metaldot.alucinados.com