Bienvenu.
> Avrei bisogno del vostro aiuto perch� ho una serie di file in
> PDF contenenti ricette di cucina che vorrei portare su excel [...]
Questo e` il problema di avere dati non strutturati... che il
super abusato .pdf, formato orientato alla stampa cartacea,
sicuramente aggrava.
Non che l'avere tutto in un foglio elettronico risolva poi
molto... le possibilita` di ricerca saranno limitate ad un
full-text search se inserisci tutta la ricetta in una unica
cella... pure l'ordinamento servira` a poco.
Se invece opti per un "vero" dbms, forse sara` un overkill
per le funzionalita` che ti interessano.
Valuta se tenere tutti i .pdf in una cartella ed usare un
programma di ricerca testuale (forse Picasa).
En passant credo che sarebbe cosa assai bella avere le ricette
su un e-reader.
Questi problemi sono il campo ideale per XML, RDF, Microformats
e compagnia bella... Nell'attesa che qualche standard s'imponga,
dovrai fare un'importazione (semi)manuale, al limite scrivendo
un parser in VBA (io l'avevo fatto per tirare fuori dati da un
vecchio programma DOS, in Excel+Access+VBA il risultato era
dignitoso... doveva essere una "soluzione temporanea", poi
anni dopo l'ho visto ancora in funzione LOL).
I formati e l'interoperabilita` sono questione che diventa sempre
piu` centrale col diffondersi di dispositivi che devono "parlarsi";
purtroppo la risposta del mercato va spesso in direzione opposta.
bye
> "andrea"
>> Ciao a tutti
>> è il mio primo post ...
>
> Bienvenu.
>
>
>
>> Avrei bisogno del vostro aiuto perchè ho una serie di file in PDF
>> contenenti ricette di cucina che vorrei portare su excel [...]
>
> Questo e` il problema di avere dati non strutturati... che il super
> abusato .pdf, formato orientato alla stampa cartacea, sicuramente
> aggrava.
In realtà il formato PDF ha il supporto per i dati strutturati, ma è da
vedere se è il caso dell'OP.
Usando Acrobat Reader, menu File -> Proprietà,
verificare se "Tagged PDF" è settato a Yes.
Anche nel caso in cui il documento sia strutturato, effettuarne il
parsing non è banale, ma dovrebbero essere disponibili dei tool per
assolvere a questo compito.
> [...]
Ciao Manlio
Si ma e` una cosa molto differente: mi pare di ricordare (lieto di
sbagliarmi) che il tagging del .pdf riguardi solamente gli aspetti
tipografici e strettamente collegati; hanno carattere opzionale e
sono apponibili a posteriori.
Quelli che dicevo prima erano metodi per descrizione semantica dei
dati, e provvedono quello che nel campo db chiameremmo "schema"
(piu altre cose ancora).
> Anche nel caso in cui il documento sia strutturato, effettuarne il
> parsing non � banale, ma dovrebbero essere disponibili dei tool per
> assolvere a questo compito.
Concordo, intendevo il parsing DOPO l'import... mi pare che l'op
avesse gia` un sistema.
> "Manlio Perillo"
>> Il Sun, 25 Oct 2009 09:19:17 +0000, The man with two watches ha
>> scritto:
>>
>>> Questo e` il problema di avere dati non strutturati... che il super
>>> abusato .pdf, formato orientato alla stampa cartacea, sicuramente
>>> aggrava.
>>
>> In realtà il formato PDF ha il supporto per i dati strutturati, ma è da
>> vedere se è il caso dell'OP.
>
> Si ma e` una cosa molto differente: mi pare di ricordare (lieto di
> sbagliarmi) che il tagging del .pdf riguardi solamente gli aspetti
> tipografici e strettamente collegati;
No, riguardano proprio la struttura logica del documento.
Le funzionalità offerte hanno molto in comune con quelle disponibili in
HTML, SGML e XML.
> [...]
Ciao Manlio
Interessante, non lo sapevo. Per tornare al problema iniziale,
a questo punto bisognerebbe vedere nei .pdf delle ricette se e
quali metadati sono presenti; nel caso, sarebbe possibile fare
un import pulito del contenuto.
Ragazzi ....grazie mille per aver preso in considerazione il mio problema
ma sinceramente
non capisco nulla di quello che avete scritto......aim� sono un profano di
queste cose ..
..mi chiedevo se qualcuno mi potesse aiutare magari dietro modesto
compenso.....
>
> non capisco nulla di quello che avete scritto
Essenzialmente che Excel non è un database (leggi: "Excel come database
uguale cacca") e che in generale i file .pdf hanno supporto per tenere i
dati di una base di dati, ma molto probabilmente non è il tuo caso.
> mi chiedevo se qualcuno mi potesse aiutare magari dietro modesto
> compenso
I dati come si presentano nel PDF? Non puoi usare un convertitore da pdf
a testo semplice, controllare che i diversi campi siano segnati in modo
corretto (virgola, tabulatore) e poi importare?