Lista de formatos ideais

14 views
Skip to first unread message

Gustavo Ericson de Melo Alexandre

unread,
Jul 16, 2014, 10:10:52 AM7/16/14
to thac...@googlegroups.com
Bom dia. Estou procurando saber quais seriam os formatos ideais de arquivo pra se programar em cima. Não conheço quase nada do assunto, mas aprendi que os do office e pdf (especialmente planilhas jogadas em pdf) são pessímas pra trabalhar. Se tivessem mais detalhes (tipo configuração ou programa que faça a melhor conversão de um pra outro), eu agradeceria bastante.

Pedro Markun

unread,
Jul 16, 2014, 12:03:17 PM7/16/14
to thackday
Gustavo,

para tabelas simples, não-relacionais e/ou sem campos hierárquicos (i.e categorias com varias subcategorias, p.ex) -> CSV
para texto simples -> TXT ou MD (Markdown) 
para documentos com campos hierárquicos -> JSON (ou XML, eu prefiro JSON se for pra tabalhar na web)
para documentos semânticos (onde a definição dos campos em si é extremamente importante p/ o documento) -> RDF
para dados geograficos -> GeoJSON
para imagens vetoriais (e imagens p/ gráficos estáticos) -> SVG

Esse são os que eu uso com alguma regularidade. Quem dá mais?

Pra converter de PDF pra TXT... o pdftotext, command line de unix funciona bem. E tenho obtido bons resultados com o calibre (que é pra ebook e usa umas regras de heuristica legais pra resolver as quebras).

Pra converter tabela em pdf é um parto. Tinham uns projetos legais em java rolando...

[]'s
Pedro Markun


2014-07-16 11:10 GMT-03:00 Gustavo Ericson de Melo Alexandre <gustavo...@gmail.com>:
Bom dia. Estou procurando saber quais seriam os formatos ideais de arquivo pra se programar em cima. Não conheço quase nada do assunto, mas aprendi que os do office e pdf (especialmente planilhas jogadas em pdf) são pessímas pra trabalhar. Se tivessem mais detalhes (tipo configuração ou programa que faça a melhor conversão de um pra outro), eu agradeceria bastante.

--
Você recebeu essa mensagem porque está inscrito no grupo quot;Transparência Hacker" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para thackday+u...@googlegroups.com.
Para postar nesse grupo, envie um e-mail para thac...@googlegroups.com.
Acesse esse grupo em http://groups.google.com/group/thackday.
Para ver essa discussão na Web, acesse https://groups.google.com/d/msgid/thackday/09ae2620-33e0-4e95-8893-0b0fa3063dde%40googlegroups.com.
Para mais opções, acesse https://groups.google.com/d/optout.

decko

unread,
Jul 16, 2014, 1:39:19 PM7/16/14
to thac...@googlegroups.com
Tem um formato de dados georeferenciados rolando na parada q é o TopoJSON. Já consegui reduções de até 90% do tamanho do arquivo.

https://github.com/mbostock/topojson



Para mais opções, acesse https://groups.google.com/d/optout.



--
@decko
André F. A. Brito
Reply all
Reply to author
Forward
0 new messages