Gustavo,
para tabelas simples, não-relacionais e/ou sem campos hierárquicos (i.e categorias com varias subcategorias, p.ex) -> CSV
para texto simples -> TXT ou MD (Markdown)
para documentos com campos hierárquicos -> JSON (ou XML, eu prefiro JSON se for pra tabalhar na web)
para documentos semânticos (onde a definição dos campos em si é extremamente importante p/ o documento) -> RDF
para dados geograficos -> GeoJSON
para imagens vetoriais (e imagens p/ gráficos estáticos) -> SVG
Esse são os que eu uso com alguma regularidade. Quem dá mais?
Pra converter de PDF pra TXT... o pdftotext, command line de unix funciona bem. E tenho obtido bons resultados com o calibre (que é pra ebook e usa umas regras de heuristica legais pra resolver as quebras).
Pra converter tabela em pdf é um parto. Tinham uns projetos legais em java rolando...
[]'s
Pedro Markun