> E isso tem uma vantagem de podermos falar em "REVISOES" dos dados em si.
> Fica relativamente fácil sabermos quando a câmara atualizou os dados, e
> sobre
> que dados estamos trabalhando.
Isso ia ser interessante mesmo. Pros dados de texto (e até as fotinhas
3x4) que a gente raspa talvez um simples repositório git só de dados
(hospedado em outro lugar que não o github, que só dá 300mb) seja uma
boa. Talvez até como uma alternativa ao rsync. Eu achei que talvez svn
fosse ocupar menos espaço, mas aparentemente não:
http://blog.affien.com/archives/2008/07/08/gits-versus-svns-storage-efficiency/
Caso a gente resolva disponibilizar pdfs e outros dados mais tipo
"blob" mesmo, talvez algo como CouchDB ou CloudKit seja melhor.
A diferença no espaço ocupado entre git e svn deve ser grande no lado do cliente. No git vem com o clone toda a história do projeto. (Eu acho que é isso.) Svn no cliente tem "somente" duas cópias de cada arquivo. Eu acho que cvs só tem uma. Mas quem é que usa cvs hoje em dia?
Mas é importante ter os dados em um repositório. Esse fim de semana mesmo o servidor da câmara entrou em pane e está dando "out of memory" pra uma proposição específica. Como eu não previa isso no meu código, acabou que perdemos alguns dos dados no CongressoAberto.
Posso criar um svn repo no próprio dreamhost, se vcs acharem uma boa. Aí (teoricamente) não haveria problema de espaço.
-e