Grazie,
M.
Puoi con vari strumenti estrarre il testo. Di più sarebbe come
ricostituire le mele dopo aver fatto la torta.
Con un software OCR si può forse ottenere qualcosa, importando in un
formato leggibile da OpenOffice e poi usando gli esportatori verso
LaTeX.
Ciao
Enrico
la cosa piu' banale alla quale riesco a pensare e' convertire il pdf in puro
testo e poi lavorare su quello. Ma naturalmente si perdono tutte le
informazioni riguardanti stile del testo ecc...
Altro passaggio potrebbe essere quello di convertire il pdf in, per esempio,
doc (esistono varie utility che lo fanno) che senza un'eccessiva perdita di
informazioni sara' poi possibile trasformare in qualcosa di accettabile per
latex.
Altro possibilita' potrebbe essere quella di convertire il pdf in html
(pdftohtml) e da li cercare di fare il possibile per ottenere il sorgente di
latex.
Metodi comunque tutti molto artigianali e poco precisi. Specie quando il
documento contiene formule
--
Pandozy vede tutto
_ _
O'|,=,/'O
(0 0)
ooO--(_)--Ooo
Con Kpdf (in KDE4 Okular) è possibile, soprattutto
se il .pdf non ha grandi dimensioni, selezionare
delle aree e copiarle negli appunti come testo.
Ovviamente anche in questo caso si perde tutta
la formattazione, ma non ci sono gli errori
che in genere gli OCR commettono nel riconoscimento
M.
Quasi tutti i programmi per leggere PDF permettono la copia
del testo. Ci potrebbero essere anche così errori, se il font
usato non ha una risorsa CMAP adatta. :(
Ciao
Enrico