Io uso un programma di estrazione di testo da pdf. Si chiama
SolidConverter PDF, ma ce ne sono diversi altri.
Ti permette /permettono di mantenere o meno la formattazione, le
immagini, le tabelle, le intestazioni...
Se ti serve spesso te lo consiglio.
Downsides:
- generano tutti dei documenti Word mooooolto piᅵ pesanti dell'originale
(a volte lo rendono proprio ingestibile). Evidentemente inserisce enormi
quantitᅵ di codice di formattazione per rispettare al massimo l'originale.
- la formattazione ᅵ piuttosto "varia": nel senso che apparentemente
vedi il testo come appare nell'originale, ma se devi sovrascriverlo (io
traduco, quindi lo uso per questo) ti vengono fuori delle differenze
sensibili non di carattere ma di spaziatura tra i caratteri anche sulla
stessa riga.
Ma se continuo ad usarlo ᅵ perchᅵ sono piᅵ i vantaggi che gli svantaggi...
Ciao,
zeta
> Mi spiego: quando copio da un documento pdf il testo su Word il testo
> non si formatta liberamente con i margini secondo la pagina di Word, ma
> conserva i suoi margini di formattazione originaria. Cos� ho una
> lunghissima serie di righe che continuano per un pezzetto a sinistra.
> Perdo ore a regolare la giustezza delle righe una ad una.
> Anche se uso "incolla speciale" (doveroso quando si copia da internet)
> Se per� riverso il testo pdf su una email Outlook Express e poi sceglio
> tra gli "sili paragrafo" la modalit� "formattato" (caratteri da
> macchina da scrivere, per intenderci), allora il testo si aggiusta da
> s�. Ma anche cos�, se poi lo copio su Word riprende il suo vezzo, con
> tutte le righe spezzate.
> Che posso fare per avere un testo ex-pdf in normale testo Word ben
> compattato e giustificato anche al margine destro?
Puoi fare tre giri con cerca/sostituisci di word.
Il carattere che usa word per andare a capo lo puoi trovare con "^p"
(senza virgolette) quindi:
1) fai un giro per sostituire tutti i "^p" con " ^p" (spazio ^p) serve
ad inserire uno spazio tra le 2 parole di fine riga e inizio della
sucessiva;
2) sostituisci tutti i ". ^p" con ".^p" in pratica togli da tutte le
righe che finiscono con il punto lo spazio aggiunto prima (molto
probabilmente si tratta di punto a capo);
3) sostituisci i " ^p" (spazio a capo) con " " (spazio) in questo modo
cancelli il carattere per andare a capo se e' preceduto da uno spazio
ma non se lo e' da un punto.
A questo punto basta scorrere il testo per trovare eventuali parole
che vanno a capo e punti a capo errati.
Per la giustificazione a destra/sinistra attivi la sillabazione e,
selezionato il tutto il testo gli dai la giustificazione corretta.
--
Ciao
Andrea Malfatti
Scusa, mi intrometto solo dire che io avrei fatto due passaggi:
1) '^p' -> ' ' (uno spazio);
2) ' ' (due spazi) -> ' ' (uno spazio), magari ripetuto pi� volte.
--
s. e. & o.
Ciao
Se non mi sbaglio cosi' togli pure gli invii di fine paragrafo
insetriti apposta.
--
Ciao
Andrea Malfatti
S�, hai ragione. Come hai ragione nel dire...
| >> A questo punto basta scorrere il testo per trovare eventuali
| >> parole che vanno a capo e punti a capo errati.
Infatti bisognerebbe poter distinguere il 'punto+spazio' di fine
periodo dal 'punto+invio' di fine paragrafo; sempre che i segni di
interpunzione siano stati inseriti correttamente nell'originale.
Ma questo, IMO, pu� essere fatto solo con occhio+cervello... :-)