Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Testi da pdf a Word. Perché non si formattano?

1,264 views
Skip to first unread message

Oliver_Kahn

unread,
Feb 18, 2010, 6:39:50 AM2/18/10
to
Mi spiego: quando copio da un documento pdf il testo su Word il testo
non si formatta liberamente con i margini secondo la pagina di Word, ma
conserva i suoi margini di formattazione originaria. Cosᅵ ho una
lunghissima serie di righe che continuano per un pezzetto a sinistra.
Perdo ore a regolare la giustezza delle righe una ad una.
Anche se uso "incolla speciale" (doveroso quando si copia da internet)
Se perᅵ riverso il testo pdf su una email Outlook Express e poi sceglio
tra gli "sili paragrafo" la modalitᅵ "formattato" (caratteri da
macchina da scrivere, per intenderci), allora il testo si aggiusta da
sᅵ. Ma anche cosᅵ, se poi lo copio su Word riprende il suo vezzo, con
tutte le righe spezzate.
Che posso fare per avere un testo ex-pdf in normale testo Word ben
compattato e giustificato anche al margine destro?

zeta

unread,
Feb 18, 2010, 7:08:12 AM2/18/10
to
Oliver_Kahn ha scritto:

> Mi spiego: quando copio da un documento pdf il testo su Word il testo
> non si formatta liberamente con i margini secondo la pagina di Word, ma
> conserva i suoi margini di formattazione originaria. Cosᅵ ho una
> lunghissima serie di righe che continuano per un pezzetto a sinistra.
> Perdo ore a regolare la giustezza delle righe una ad una.
....

> Che posso fare per avere un testo ex-pdf in normale testo Word ben
> compattato e giustificato anche al margine destro?
>

Io uso un programma di estrazione di testo da pdf. Si chiama
SolidConverter PDF, ma ce ne sono diversi altri.

Ti permette /permettono di mantenere o meno la formattazione, le
immagini, le tabelle, le intestazioni...

Se ti serve spesso te lo consiglio.

Downsides:
- generano tutti dei documenti Word mooooolto piᅵ pesanti dell'originale
(a volte lo rendono proprio ingestibile). Evidentemente inserisce enormi
quantitᅵ di codice di formattazione per rispettare al massimo l'originale.

- la formattazione ᅵ piuttosto "varia": nel senso che apparentemente
vedi il testo come appare nell'originale, ma se devi sovrascriverlo (io
traduco, quindi lo uso per questo) ti vengono fuori delle differenze
sensibili non di carattere ma di spaziatura tra i caratteri anche sulla
stessa riga.

Ma se continuo ad usarlo ᅵ perchᅵ sono piᅵ i vantaggi che gli svantaggi...

Ciao,
zeta


Andrea Malfatti

unread,
Feb 18, 2010, 9:32:53 AM2/18/10
to
Il Thu, 18 Feb 2010 11:39:50 GMT, Oliver_Kahn ha scritto:

> Mi spiego: quando copio da un documento pdf il testo su Word il testo
> non si formatta liberamente con i margini secondo la pagina di Word, ma

> conserva i suoi margini di formattazione originaria. Cos� ho una

> lunghissima serie di righe che continuano per un pezzetto a sinistra.
> Perdo ore a regolare la giustezza delle righe una ad una.
> Anche se uso "incolla speciale" (doveroso quando si copia da internet)

> Se per� riverso il testo pdf su una email Outlook Express e poi sceglio
> tra gli "sili paragrafo" la modalit� "formattato" (caratteri da

> macchina da scrivere, per intenderci), allora il testo si aggiusta da

> s�. Ma anche cos�, se poi lo copio su Word riprende il suo vezzo, con

> tutte le righe spezzate.
> Che posso fare per avere un testo ex-pdf in normale testo Word ben
> compattato e giustificato anche al margine destro?

Puoi fare tre giri con cerca/sostituisci di word.

Il carattere che usa word per andare a capo lo puoi trovare con "^p"
(senza virgolette) quindi:
1) fai un giro per sostituire tutti i "^p" con " ^p" (spazio ^p) serve
ad inserire uno spazio tra le 2 parole di fine riga e inizio della
sucessiva;
2) sostituisci tutti i ". ^p" con ".^p" in pratica togli da tutte le
righe che finiscono con il punto lo spazio aggiunto prima (molto
probabilmente si tratta di punto a capo);
3) sostituisci i " ^p" (spazio a capo) con " " (spazio) in questo modo
cancelli il carattere per andare a capo se e' preceduto da uno spazio
ma non se lo e' da un punto.

A questo punto basta scorrere il testo per trovare eventuali parole
che vanno a capo e punti a capo errati.

Per la giustificazione a destra/sinistra attivi la sillabazione e,
selezionato il tutto il testo gli dai la giustificazione corretta.
--
Ciao
Andrea Malfatti

errante

unread,
Feb 18, 2010, 11:14:36 AM2/18/10
to
"Andrea Malfatti":

>> quando copio da un documento pdf il testo su Word il
>> testo non si formatta liberamente con i margini secondo la
>> pagina di Word
> Puoi fare tre giri con cerca/sostituisci di word.
> Il carattere che usa word per andare a capo lo puoi trovare con
> "^p" (senza virgolette) quindi:
> [...]

Scusa, mi intrometto solo dire che io avrei fatto due passaggi:
1) '^p' -> ' ' (uno spazio);
2) ' ' (due spazi) -> ' ' (uno spazio), magari ripetuto pi� volte.
--
s. e. & o.
Ciao

Andrea Malfatti

unread,
Feb 19, 2010, 4:34:45 AM2/19/10
to

Se non mi sbaglio cosi' togli pure gli invii di fine paragrafo
insetriti apposta.
--
Ciao
Andrea Malfatti

errante

unread,
Feb 19, 2010, 5:40:37 AM2/19/10
to
"Andrea Malfatti":

>>> Puoi fare tre giri con cerca/sostituisci di word.
>>> [...]
>> Scusa, mi intrometto solo dire che io avrei fatto due passaggi:
>> [...]

> Se non mi sbaglio cosi' togli pure gli invii di fine paragrafo
> insetriti apposta.

S�, hai ragione. Come hai ragione nel dire...


| >> A questo punto basta scorrere il testo per trovare eventuali
| >> parole che vanno a capo e punti a capo errati.

Infatti bisognerebbe poter distinguere il 'punto+spazio' di fine
periodo dal 'punto+invio' di fine paragrafo; sempre che i segni di
interpunzione siano stati inseriti correttamente nell'originale.
Ma questo, IMO, pu� essere fatto solo con occhio+cervello... :-)

0 new messages