Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Da Pdf a Latex?

896 views
Skip to first unread message

user

unread,
Mar 18, 2010, 7:44:57 AM3/18/10
to
Domanda strana che mi hanno fatto. Esiste qualcosa che in modo anche
rudimentale e impreciso (ovviamente) possa convertire da un pdf in
latex o simil-latex? Mi sembra difficile ma magari hanno provato anche
a fare una cosa del genere, ammesso che sia possibile.

Grazie,
M.

Enrico Gregorio

unread,
Mar 18, 2010, 8:17:31 AM3/18/10
to
user <us...@domain.invalid> scrive:

Puoi con vari strumenti estrarre il testo. Di più sarebbe come
ricostituire le mele dopo aver fatto la torta.

Con un software OCR si può forse ottenere qualcosa, importando in un
formato leggibile da OpenOffice e poi usando gli esportatori verso
LaTeX.

Ciao
Enrico

ivan_...@tiscali.it

unread,
Mar 18, 2010, 8:21:02 AM3/18/10
to
giovedì 18 marzo 2010 12:44 user ebbe a dire:

la cosa piu' banale alla quale riesco a pensare e' convertire il pdf in puro
testo e poi lavorare su quello. Ma naturalmente si perdono tutte le
informazioni riguardanti stile del testo ecc...

Altro passaggio potrebbe essere quello di convertire il pdf in, per esempio,
doc (esistono varie utility che lo fanno) che senza un'eccessiva perdita di
informazioni sara' poi possibile trasformare in qualcosa di accettabile per
latex.

Altro possibilita' potrebbe essere quella di convertire il pdf in html
(pdftohtml) e da li cercare di fare il possibile per ottenere il sorgente di
latex.

Metodi comunque tutti molto artigianali e poco precisi. Specie quando il
documento contiene formule

--
Pandozy vede tutto
_ _
O'|,=,/'O
(0 0)
ooO--(_)--Ooo

Mauro Sacchetto

unread,
Mar 18, 2010, 5:50:06 PM3/18/10
to
Enrico Gregorio wrote:
> Con un software OCR si può forse ottenere qualcosa, importando in un
> formato leggibile da OpenOffice e poi usando gli esportatori verso
> LaTeX.

Con Kpdf (in KDE4 Okular) è possibile, soprattutto
se il .pdf non ha grandi dimensioni, selezionare
delle aree e copiarle negli appunti come testo.
Ovviamente anche in questo caso si perde tutta
la formattazione, ma non ci sono gli errori
che in genere gli OCR commettono nel riconoscimento

M.

Enrico Gregorio

unread,
Mar 18, 2010, 5:56:01 PM3/18/10
to
Mauro Sacchetto <mauro.s...@gmail.com> scrive:

Quasi tutti i programmi per leggere PDF permettono la copia
del testo. Ci potrebbero essere anche così errori, se il font
usato non ha una risorsa CMAP adatta. :(

Ciao
Enrico

0 new messages