Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

PDF Import reprise

8 views
Skip to first unread message

VITRIOL

unread,
Jun 7, 2008, 3:38:19 AM6/7/08
to
Finalmente sono riuscito a mette le manacce sull'estensione PDF Import
per Win è l'ho potuta provare :-)
Commento a caldo: sembra abbastanza impressionate.
I PDF vendo aperti in modifica nell'applicazione Draw, e il layout del
documento originale viene mantenuto accuratamente.
Qui il mio classico documento di test aperto nel visualizzatore PDF:

http://img84.imageshack.us/img84/2038/pdf1zo3.png

Qui invece lo stesso PDF importato in Draw:

http://img84.imageshack.us/img84/2688/pdf2oj0.png

Niente male, vero?
Nota negativa, che quella c'è sempre. I testi verranno riconosciuti come
un box di testo per ogni riga, quindi i paragrafi vanno persi.
A quanto pare questo è un problema irrisolvibile, perché il formato PDF,
nato per la visualizzazione e per la stampa, non contiene questo tipo di
informazioni sulla formattazione.
Già qui ci sarebbe da essere soddisfatti, ma a questo si aggiunge la
possibilità di esportare e importare PDF ibridi. Questa caratteristica,
a mio avviso, apre davvero nuovi scenari di utilizzo per OpenOffice.
Di cosa si tratta? In due parole, un PDF ibrido è un documento PDF che
contiene incorporato il documento originale che lo generato.
Ad esempio, se si crea un documento con Writer e lo si esporta come PDF
ibrido, si crea un PDF visualizzabile con qualsiasi PDF reader, come se
fosse un normale PDF. Quando però lo si riapre all'interno di Writer
(magia) il programma non apre il PDF ma il documento ODF che è
incorporato. Quindi è possibile apportare qualsiasi modifica al
documento, come se fosse un normale documento Writer, e poi esportarlo
di nuovo in PDF ibrido (o quello che si vuole).
Nota negativa (immancabile). Ho provato, e questo non risolve il
problema dei font incorporati. Writer tratta il PDF ibrido come un
normale documento Writer, quindi non prende il font dal PDF. Ergo, se il
font non è installato sul sistema, verrà sostituito. Fermo restando che
se letto come normale PDF il font originale viene tranquillamente
riconosciuto.
Che dire, alla fine? Sia OOo 3.0 (obbligatorio per usare l'estensione),
che l'estensione stessa, non sono ancora in versione definitiva, ma
l'impressione è già molto positiva.
Un piccolo nuovo mondo per OpenOffice.

--
news:it-alt.comp.software.openoffice : Il newsgroup dedicato a
OpenOffice.org, la suite open source di applicazioni per ufficio.

Saluti, VITRIOL

VITRIOL

unread,
Jun 7, 2008, 3:43:59 AM6/7/08
to
Dimenticavo la cosa più importante, per chi volesse divertirsi a
sperimentare :-)

http://ftp.linux.cz/pub/localization/OpenOffice.org/devel/DEV300/DEV300_m17/Build-1/

Alberto

unread,
Jun 7, 2008, 7:01:37 AM6/7/08
to
VITRIOL ha scritto:

> Dimenticavo la cosa più importante, per chi volesse divertirsi a
> sperimentare :-)
>
> http://ftp.linux.cz/pub/localization/OpenOffice.org/devel/DEV300/DEV300_m17/Build-1/
>
>

ciao ho installato l'estensione per l'importazione dei pdf, ma dove
comare in draw?
Grazie
Alberto

VITRIOL

unread,
Jun 7, 2008, 7:11:50 AM6/7/08
to
Alberto ha scritto:

> ciao ho installato l'estensione per l'importazione dei pdf, ma dove
> comare in draw?

Non compare da nessuna parte. Basta che da Draw (o da qualunque altra
applicazione OOo) apri il documento PDF con File > Apri..., come faresti
con un documento qualsiasi.
Invece per salvare un PDF ibrido in File > Esporta nel formato PDF... >
[scheda] Generale, l'estensione ti aggiunge la voce "Crea un file
ibrido". Per aprire il PDF ibrido sempre File > Apri...
Tutto qui.

Alberto

unread,
Jun 7, 2008, 8:23:06 AM6/7/08
to
VITRIOL ha scritto:

> Alberto ha scritto:
>
>> ciao ho installato l'estensione per l'importazione dei pdf, ma dove
>> comare in draw?
>
> Non compare da nessuna parte. Basta che da Draw (o da qualunque altra
> applicazione OOo) apri il documento PDF con File > Apri..., come faresti
> con un documento qualsiasi.
> Invece per salvare un PDF ibrido in File > Esporta nel formato PDF... >
> [scheda] Generale, l'estensione ti aggiunge la voce "Crea un file
> ibrido". Per aprire il PDF ibrido sempre File > Apri...
> Tutto qui.
>

non mi funziona.... peccato: mi segnala errori. Uso la versione 3 beta
di OOo sotto win

VITRIOL

unread,
Jun 7, 2008, 8:27:47 AM6/7/08
to
Alberto ha scritto:

> non mi funziona.... peccato: mi segnala errori. Uso la versione 3 beta
> di OOo sotto win

Non so se la 3.0 beta è pienamente compatibile. Ma gli errori te li dà
solo con alcuni PDF o con tutti?
Comunque ti consiglio di rimuovere la beta e di installare la DEV300_m17
presente al link che ho indicato, che è la più recente versione disponibile.
Io con la DEV300_m17 tutte le prove che ho fatto sono andate a buon fine.

Alberto

unread,
Jun 7, 2008, 8:41:30 AM6/7/08
to
VITRIOL ha scritto:

> Alberto ha scritto:
>
>> non mi funziona.... peccato: mi segnala errori. Uso la versione 3 beta
>> di OOo sotto win
>
> Non so se la 3.0 beta è pienamente compatibile. Ma gli errori te li dà
> solo con alcuni PDF o con tutti?

Con tutti

> Comunque ti consiglio di rimuovere la beta e di installare la DEV300_m17
> presente al link che ho indicato, che è la più recente versione
> disponibile.
> Io con la DEV300_m17 tutte le prove che ho fatto sono andate a buon fine.
>

scarico da qui la versione per win:

http://ftp.linux.cz/pub/localization/OpenOffice.org/devel/DEV300/DEV300_m17/Build-1/OOo_3.0.0_080606_Win32Intel_install_it.exe

Provo.
Grazie

VITRIOL

unread,
Jun 7, 2008, 8:42:25 AM6/7/08
to
Alberto ha scritto:

E' quella che sto usando io in questo momento, e non ho problemi.

Alberto

unread,
Jun 7, 2008, 8:58:16 AM6/7/08
to
VITRIOL ha scritto:

> Alberto ha scritto:
>
>> scarico da qui la versione per win:
>>
>> http://ftp.linux.cz/pub/localization/OpenOffice.org/devel/DEV300/DEV300_m17/Build-1/OOo_3.0.0_080606_Win32Intel_install_it.exe
>>
>
> E' quella che sto usando io in questo momento, e non ho problemi.
>

hai ragione: funziona alla perfezione e mi sembra anche più veloce della
beta che avevo io.
Grazie
Alberto

VITRIOL

unread,
Jun 7, 2008, 8:58:14 AM6/7/08
to
Alberto ha scritto:

> hai ragione: funziona alla perfezione e mi sembra anche più veloce della
> beta che avevo io.

Quindi confermi che funziona anche l'estensione?

Alberto

unread,
Jun 7, 2008, 9:08:54 AM6/7/08
to
VITRIOL ha scritto:

> Alberto ha scritto:
>
>> hai ragione: funziona alla perfezione e mi sembra anche più veloce
>> della beta che avevo io.
>
> Quindi confermi che funziona anche l'estensione?
>

alla perfezione: che goduria!!!
Ho provato pagine pdf anche di una certa complessità e si può modificare
il testo, cancellare, spostare immagini. Ho provato anche a farlo
"sbagliare" aprendo da writer un file pdf e, dopo una certa titubanza,
me l'ho aperto correttamente con draw.

VITRIOL

unread,
Jun 7, 2008, 9:16:40 AM6/7/08
to
Alberto ha scritto:

> alla perfezione: che goduria!!!

OK, allora è proprio come pensavo.
Sono entrambe versioni in sviluppo e vengono portate avanti
contemporaneamente, quindi è comprensibile che le compatibilità sia
reciprocamente dipendente.
Comunque in fin dei conti i PDF ibridi rendono in qualche modo quasi
obsoleta la possibilità di importare i PDF normali, almeno all'interno
dell'uso di OOo. Con un PDF ibrido la possibilità di editing è comunque
molto superiore, direi perfetta.
Certo la possibilità di importare PDF tradizionali resta importante
quando si vuole editare documenti prodotti con altre applicazioni.
In ogni caso direi proprio che hanno fatto un lavoro egregio, e prima
del rilascio finale ci sono ancora possibilità di miglioramento.
Come la prenderà Adobe col suo costosissimo Acrobat? :-)

Alberto

unread,
Jun 7, 2008, 9:32:36 AM6/7/08
to
VITRIOL ha scritto:

> Alberto ha scritto:
>
>> alla perfezione: che goduria!!!
>
> OK, allora è proprio come pensavo.
> Sono entrambe versioni in sviluppo e vengono portate avanti
> contemporaneamente, quindi è comprensibile che le compatibilità sia
> reciprocamente dipendente.
> Comunque in fin dei conti i PDF ibridi rendono in qualche modo quasi
> obsoleta la possibilità di importare i PDF normali, almeno all'interno
> dell'uso di OOo. Con un PDF ibrido la possibilità di editing è comunque
> molto superiore, direi perfetta.
> Certo la possibilità di importare PDF tradizionali resta importante
> quando si vuole editare documenti prodotti con altre applicazioni.
> In ogni caso direi proprio che hanno fatto un lavoro egregio, e prima
> del rilascio finale ci sono ancora possibilità di miglioramento.
> Come la prenderà Adobe col suo costosissimo Acrobat? :-)
>

Non so come la prenderà Adobe, ma penso (e spero) che questa nuova
importantissima e utilissima funzione serva a convincere ancor più
utilizzatori a passare a questa fantastica suite. Certo che il
passa-parola tra gli utenti non credo sia sufficiente e smuovere la
pigrizia e l'indolenza di molte persone che da anni si sono abituate ad
usare i pur validi prodotti microsoft. Nella scuola dove insegno è duro
far comprendere che questa migrazione potrebbe solo portare dei
vantaggi, ma tanti pensano: perché devo usare openoffice quando ho a
disposizione un office craccato e perfettamente funzionante.... è la
mentalità da cambiare...

BubbleBobble

unread,
Jun 7, 2008, 5:25:04 PM6/7/08
to
Ciao Vitriol, come posso fare per importare un pdf (tipicamente
fatture) in calc...? seleziono tutto da draw e faccio incolla
speciale ? vorrei fosse mantenuta la formattazione della pagina:
colonne, celle, ecc. TIA :)

VITRIOL

unread,
Jun 8, 2008, 3:55:39 AM6/8/08
to
BubbleBobble ha scritto:

Non so se in questo caso il filtro PDF potrebbe essere utile. Facendo
copia/incolla da Draw a Calc non so neppure se sia possibile farlo
riconoscere come testo nelle varie celle.
Se fai semplicemente copia/incolla del testo dal visualizzatore PDF cosa
succede?

BubbleBobble

unread,
Jun 8, 2008, 8:05:10 AM6/8/08
to
On 8 Giu, 08:55, VITRIOL <vitriol_vitriolTOGL...@katamail.com> wrote:

> Se fai semplicemente copia/incolla del testo dal visualizzatore PDF cosa
> succede?

Eh, non viene mantenuta la suddivisione in colonne... tutto testo
attacato!
Mi tocca usare lo strumento "testo in colonne", ma non sempre è facile
definire i limitatori, senza contare che poi c'è bisogno di
rimaneggiare il tutto per eliminare spazi vuoti, ecc.

Penso dipenda dal fatto che viene copiato come testo (txt) da Foxit
Reader e/o Xchange-PdfViewer.

Ho ottenuto invece ottimi risultati con un programma shareware, che si
chiamava tipo Pdf2Excel (o simile), non ricordo bene perchè scaduto
l'ho disinstallato. In pratica una sorta di OCR per i Pdf.

Che è quello che poi cerco di fare io. Per spiegare: con le fatture
cartacee, scannerizzo e poi uso aabby 4.0 (trovato su un cd di
computer idea) per riconoscere in ocr, e mi viene correttamente
suddivisa la fattura in colonne cosicchè posso copiare da aabby
finereader a calc.
Il problema mi si pone quando ho solo la copia in pdf delle fatture
(certo potrei stamparla e scannerizzarla o fare una jpeg dal pdf ad es
con xchange per poi ricavarne l'ocr).

Grazie x la risposta!

VITRIOL

unread,
Jun 8, 2008, 8:13:13 AM6/8/08
to
BubbleBobble ha scritto:

> Eh, non viene mantenuta la suddivisione in colonne... tutto testo
> attacato!

Ho fatto una semplice prova. Da Calc ho esportato una tabella elementare
come PDF, poi ho aperto il PDF in Draw con PDF Import, e ho provato a
copiare tutto e incollare di nuovo in Calc.
Risultato, nulla da fare perché viene incollato come oggetto Draw o come
immagine, ma non come testo.

BubbleBobble

unread,
Jun 8, 2008, 8:52:48 AM6/8/08
to
On 8 Giu, 13:13, VITRIOL <vitriol_vitriolTOGL...@katamail.com> wrote:

> Risultato, nulla da fare perché viene incollato come oggetto Draw o come
> immagine, ma non come testo.

nemmeno con "incolla speciale" e poi selezionando solo testo-numeri-
data-formato ...?
o cmq incolla speciale > testo formattato come rtf ?

VITRIOL

unread,
Jun 8, 2008, 9:05:58 AM6/8/08
to
BubbleBobble ha scritto:

> nemmeno con "incolla speciale" e poi selezionando solo testo-numeri-
> data-formato ...?
> o cmq incolla speciale > testo formattato come rtf ?

No, perché se da Draw copi uno o piů box di testo interi, questi vengono
riconosciti come oggetto, e non come testo.
Per farlo riconoscere come testo dovresti selezionare e copiare il testo
presente all'interno del box, ma lo dovresti fare un box alla volta,
quindi la stessa cosa tediosa che potresti fare direttamente dal PDF.

PauLoX

unread,
Jun 10, 2008, 8:35:55 AM6/10/08
to
On 7 Giu, 09:38, VITRIOL wrote:
> Nota negativa, che quella c'è sempre. I testi verranno riconosciuti come
> un box di testo per ogni riga, quindi i paragrafi vanno persi.

Se potrebbe non essere un problema nell'importazione di brevi
documenti,
locandine, etc ... per l'importazione di lunghi documenti da
modificare
mi sembra una bella limitazione perchè renderebbe impossibile
l'intervento
massiccio sulla formattazione

> A quanto pare questo è un problema irrisolvibile, perché il formato PDF,
> nato per la visualizzazione e per la stampa, non contiene questo tipo di
> informazioni sulla formattazione.

Potrebbero però prevedere una opzione che faccia il merge di tutte le
linee
in paragrafi, anche a costo magari di non avere il layout identico.

Complimenti comunque mi sembra una di quelle opzioni decisive per far
si
che le persone cancellino i loro Office senza licenza dal computer ed
inizino ad usare software libero.

Paolo

PauLoX

unread,
Jun 10, 2008, 8:58:05 AM6/10/08
to
On 10 Giu, 14:35, PauLoX <gpau...@gmail.com> wrote:
> On 7 Giu, 09:38, VITRIOL wrote:
>> Nota negativa, che quella c'è sempre. I testi verranno riconosciuti come
>> un box di testo per ogni riga, quindi i paragrafi vanno persi.
> ... per l'importazione di lunghi documenti da modificare
> mi sembra una bella limitazione perchè renderebbe impossibile
> l'intervento massiccio sulla formattazione

Dopo qualche test mi sembra che i vari box di testo si possano solo
raggruppare e non fondere insieme il che avrebbe risolto qualche
problema.

> Complimenti comunque mi sembra una di quelle opzioni decisive per far
> si che le persone cancellino i loro Office senza licenza dal computer
> ed inizino ad usare software libero.

Molto comoda è l'esportazione del pdf con l'odt incapsulato.

Paolo

Lutrin

unread,
Jun 10, 2008, 9:00:57 AM6/10/08
to
On Tue, 10 Jun 2008 05:58:05 -0700, PauLoX ci disse:

> Molto comoda è l'esportazione del pdf con l'odt incapsulato.

[...]
quindi se si esporta così, la formattazione viene garantita in toto? cioé
al momento dell'importazione viene estratto e letto il file odt?
--
Puppy Linux wiki: http://puppylover.netsons.org/dokupuppy
Puppy Linux Forum: http://puppylinux.ilbello.com
Windows me genuit, Ubuntu rapuere / tenet nunc Puppy Linux...

VITRIOL

unread,
Jun 10, 2008, 9:12:12 AM6/10/08
to
Lutrin ha scritto:

> quindi se si esporta così, la formattazione viene garantita in toto? cioé
> al momento dell'importazione viene estratto e letto il file odt?

Esattamente. Writer aprirà il documento ODT incorporato, ignorando il PDF.
E' per questo che io considero i PDF ibridi una funzionalità ancora più
importante di quella offerta dalla importazione dei PDF tradizionali.
In un colpo solo viene data la possibilità di visualizzare un documento
con la fedeltà e la semplicità di un PDF, ma si mantiene la possibilità
di una importazione in modifica perfetta.

Lutrin

unread,
Jun 10, 2008, 9:21:04 AM6/10/08
to
On Tue, 10 Jun 2008 15:12:12 +0200, VITRIOL ci disse:

> Esattamente. Writer aprirà il documento ODT incorporato

[...]
quindi il problema dell'incorporazione font dovrebbe essere risolto oramai

VITRIOL

unread,
Jun 10, 2008, 9:23:30 AM6/10/08
to
Lutrin ha scritto:

> quindi il problema dell'incorporazione font dovrebbe essere risolto oramai

Solo in lettura, ma non in modica.

VITRIOL

unread,
Jun 10, 2008, 9:24:06 AM6/10/08
to
VITRIOL ha scritto:

> modica

modifica...

Lutrin

unread,
Jun 10, 2008, 9:26:34 AM6/10/08
to
On Tue, 10 Jun 2008 15:23:30 +0200, VITRIOL ci disse:

> Solo in lettura, ma non in modifica
[...]
lo temevo. siamo punto e da capo allora. visto che dovrò sempre inviare i
font con cui ho scritto il documento

VITRIOL

unread,
Jun 10, 2008, 9:32:11 AM6/10/08
to
Lutrin ha scritto:

> lo temevo. siamo punto e da capo allora. visto che dovrò sempre inviare i
> font con cui ho scritto il documento

Il problema dei font incorporati non è affatto banale. Come ho già avuto
modo di dire, occorrerebbe valutare se è tecnicamente realizzabile
rispettando le specifiche ODF.
Io questo non lo sono ancora riuscito a capire con esattezza.

Tommy

unread,
Jun 10, 2008, 2:13:59 PM6/10/08
to
se non ho capito male una "feature" del genere MS Word se la sogna
vera?

VITRIOL

unread,
Jun 10, 2008, 2:21:55 PM6/10/08
to
Tommy ha scritto:

> se non ho capito male una "feature" del genere MS Word se la sogna
> vera?

Direi proprio di sì. Sia l'importazione dei PDF tradizionali che la
gestione dei PDF ibridi.
Ma anche la semplice esportazione in PDF non è disponibile per default,
tranne che con Office 2007 più specifico plug-in. Invece OOo di suo
genera dei PDF con mille funzionalità; con link, segnalibri, protezioni ecc.

Message has been deleted

VITRIOL

unread,
Jun 12, 2008, 12:47:08 AM6/12/08
to
AlphaboX ha scritto:

> ...mi aspettavo di vedere qualche cosa nella 2.4.1, riguardo questa
> nuova feature, invece temo che si debba aspettare ancora.

Funziona solo con OOo 3.0, ma questo si sapeva da quando la funzionalità
è stata annunciata.

> Come si comporta con i PDF protetti ??

Per ora non li importa proprio, neppure se si conosce la pw. Però qui
dice che sarà possibili in futuro, quindi sono ottimista:-)

http://blogs.sun.com/GullFOSS/entry/pdf_import_extension_is_now

Import of PDF documents with restricted permissions is not yet possible,
this feature will be available in later versions.

PauLoX

unread,
Jun 12, 2008, 4:18:52 AM6/12/08
to
On 10 Giu, 14:58, PauLoX <gpau...@gmail.com> wrote:
> On 10 Giu, 14:35, PauLoX <gpau...@gmail.com> wrote:
>> On 7 Giu, 09:38, VITRIOL wrote:
>>> Nota negativa, che quella c'è sempre. I testi verranno riconosciuti come
>>> un box di testo per ogni riga, quindi i paragrafi vanno persi.
>> ... per l'importazione di lunghi documenti da modificare
>> mi sembra una bella limitazione perché renderebbe impossibile

>> l'intervento massiccio sulla formattazione
> ... mi sembra che i vari box di testo si possano solo raggruppare

> e non fondere insieme il che avrebbe risolto qualche problema.

Qualcuno sa come estrapolare il testo dai box di testo per poi
ricostruire i pragrafi?

Paolo

VITRIOL

unread,
Jun 12, 2008, 4:24:05 AM6/12/08
to
PauLoX ha scritto:

> Qualcuno sa come estrapolare il testo dai box di testo per poi
> ricostruire i pragrafi?

Temo che l'unica possibilità sia selezionare e copiare il testo
all'interno dei singoli box. Non copiare il box intero, ma prorio il
testo che vi è contenuto.
Comunque leggi il mio messaggio "Estensione PDF Import ora ufficialmente
su OOo Extensions", perché credo che in futuro ci saranno belle novità :-)

Message has been deleted

VITRIOL

unread,
Jun 13, 2008, 1:34:46 AM6/13/08
to
AlphaboX ha scritto:

> Visto che l'importazione del pdf comporta una manipolazione (ed
> interpretazione) del vettoriale, sei a conoscenza riguardo la
> possibilità di importare files di immagini VETTORIALI ??

Se intendi nello specifico il supporto del formato SVG, attualmente è
una delle nuove funzionalità più richieste, e di sicuro ci stanno
lavorando. Non sono noti i tempi, ma ogni tanto esce qualche articolo
che annuncia i progressi in questa direzione.
Qui per seguire gli sviluppi:

http://www.openoffice.org/issues/show_bug.cgi?id=2497

Da notare che con 405 voti, questa è probabilmente la segnalazione
ancora aperta più votata in assoluto.
Invece altri formati vettoriali sono già supportati, oltre naturalmente
al formato nativo ODG.

Message has been deleted

VITRIOL

unread,
Jun 14, 2008, 2:29:47 AM6/14/08
to
AlphaboX ha scritto:

> Secondo te, ci sarà una possibilità remota di una futura evoluzione
> della suite, introducendo una vera e propria applicazione per il
> disegno vettoriale, compatibile con i formati EPS ed AI ???

L'applicazione per il disegno vettoriale c'è già ed è Draw.
EPS è già supportato in importazione, ma non so bene con quale
accuratezza. AI no, ma dichiaro la mia ignoranza dicendo che non so casa
sia. Adobe Illustrator?

OT
Rimanendo nel campo dell'open source, per il disegno vettoriale c'è
sempre l'ottimo Inkscape, che sicuramente offre maggiori funzionalità
rispetto a Draw. E' però più complesso da utilizzare, ma credo che sia
inevitabile.

0 new messages