Sorry Andres, vamos lá, primeiro às perguntas:
>> Nesse primeiro momento, analiso só as bases na pasta "Orçamento", ou
>> nas
>> outras (como CMDB) tb?
Nosso foco será 3 áreas: Receita (De onde vem o dinheiro), Planejamento
(O que
espera-se fazer com ele), Execução (O que foi/está sendo feito). Dados
como CMDB
ou indicadores acho importantíssimos, mas talvez para um segundo
momento. Os dados
do CMDB por exemplo serviriam muito bem para uma análise dos formatos
mais utilizados
nas liberações de dados, estatísticas de quão bom a abertura de dados
está sendo, etc
E os indicadores seriam fundamentais para analisar se as políticas
públicas estão
suprindo algum tipo de efeito, pelo menos numa análise primária de
correlação.
> Erm... era para eu estar mandando estes e-mails para as duas listas
> ou apenas
> para uma?
Pode colocar nas duas se quiser, por enquanto as perguntas ainda estão
gerais o suficiente
pra não assustar quem está na lista não "-dev". (Bom, na verdade não
sei, alguém aí
está acompanhando as discussões sem se perder?)
Quanto ao seu grafo, é interessante mas seria melhor tentarmos nos
organizar no wiki,
pois o grafo é confuso e mais difícil de modificar ou acrescentar
detalhes (por exemplo
em ítens como "Escolher uma coluna da tabela" seria legal colocarmos
uma referência
a quais colunas possíveis/interessantes, adicionar referências para as
sugestões de
visualizações, etc). O mais importante disso tudo é sempre tentarmos
mapear a cada
sugestão de visualização (treemap, bolhas, etc) ou fonte dos dados
(base de execução
por ano, por mês) de onde tais dados partiriam, referenciando o que
temos no github
e a fonte do site da prefeitura.
Ainda não comecei o processo organizacional no wiki, mas estou
explorando os dados
de planejamento para entender quais volumes de categorias e valores
possuímos para
pensar nas visualizações. Por enquanto o que já explorei encontra-se
aqui:
http://nbviewer.ipython.org/github/okfn-brasil/gastos_abertos_dados/blob/master/notebooks/Aprovado%202014.ipynb
E já surgiram diversas questões:
* Os valores aprovados são os valores finais da LOA?
* O que exatamente são as Fontes e como detalharemos isso para os
usuários do site.
* O que exatamente são os Fundos e como detalharemos isso para os
usuários do site.
* Qual melhor forma de representarmos os valores tão díspares das
Secretarias? 24 secretarias
com grande variação entre elas. Me parece que um treemap iria acabar
eclipsando muito a maior
parte das secretarias, exceto as 4 que mais recebem (Educação,
Infra-estrutura, Transporte e
Habitação).
* Olhando para a distribuição dos valores por subprefeituras fiquei em
dúvida de quais outras
bases de dados poderemos cruzar para entender tais diferenças na
distribuição do orçamento.
Estava comparando por exemplo com os dados populacionais por
subprefeitura, mas tive algumas
surpresas, por exemplo, o valor aprovado está está longe de possuir
uma forte correlação com
a número populacional na região de uma subprefeitura.
* Por que tão grande a diferença de valores para secretarias (94%) com
os valores para
subprefeituras (6%).
* Como entender (onde buscar tais informações?) e como visualizar as
grandes diferença nas Unidades
do orçamento? Aliás, o que é uma unidade do orçamento? Por que a
maior parte do dinheiro vai
para o Gabinete do Secretário? Na prática o que isso significa?
* Quais agrupamentos mais finos faremos e como em cada uma das colunas
dos dados? Por exemplo, em Unidades
existem Hospitais, Coordenadorias, Fundos, etc
Boa parte dessas questões deveriam já ter sido colocadas no wiki, farei
assim que possível, mas podemos
continuar a discussão na lista sem problemas.
Abs,
Edgar