Ciao Michele, Ciao Irene
sinceramente non potevo sperare in
commenti migliori. Michele so bene che questi temi ti stanno a cuore, e
apprezzo la forte criticità dsull'argomento perchè, in effetti, il
pericolo di un'errata percezione ora è alto, e rischia di rovinare il
mercato che con fatica si sta venendo a creare.
Ci tengo subito a
dire, mea culpa di non averlo fatto prima, che ODG è ancora in fase
sviluppo. Qui a EvoDevo seguiamo anche molti altri progetti questo 2013,
ed essenso in pochi abbiamo dovuto congelare per qualche mese lo
sviluppo della piattaforma. Quando, mesi fa, abbiamo implementato il
modulo di conversione formati (RDF compreso, ancora la V2 di CKAN non
aveva fatto uscire il suo) stavamo cercando di automatizzare la
serializzazione a partire dai CSV. Ovviamente, ma come ha anticipato
Michele, il layer di modellazione dati è ancora in fase di test. Per
questa ragione non lo abbiamo ancora inserito nella beta.
A
prescindere dalla piattaforma concordo sull'errata equivalenza
RDF=lInked data, soprattutto perchè, a mio parere, esistono altre
soluzioni. Ciò non toglie che probabilmente l'owl rimane il formato
semantico più efficiente, permettendo una modellazione (per nulla
semplice se la vuoi fare bene) molto dettagliata e dinamica dei dati. In
ogni caso, e qua mi scatta la curiosità verso la soluzione
"semplificata" di Michele, ci sono altre soluzioni leggere ma
altrettanto efficaci come il JSONLD (sul quale sto lavorando da un pò).
Credo con Irene che la questione della percezione sia un lavoro continuo
che interessa e conivolge in primis la comunità di chi si occupa, come
noi, di queste cose. E ha ricadute su di essa. Questo significa però
solamente che ogni passo in avanti che si fà comporta la responsabilità
di avanzare verso una certa direzione o verso un'altra. La direzione che
suggerisce Michele, quella di "aggiungere valore a chi quei dati poi
deve riutilizzarli", è quella verso la quale personalmente auspico anche
io. E mi rendo conto che generare confusione sui Linked significa
ritardare lo sviluppo di un datamarket solido e di data marketplace di
qualità. Credo, ad esempio, che sfide come quelle di Dandelion in Italia
(si, sono un fan) o Enigma.io in USA indichino un percorso molto
lungimirante ma sopratutto possibile di sviluppo nell'utilizzo di dati
pubblici, privati o open che siano.
Siccome il mio compito,
quando lavoro con le amministrazioni, è quello di aiutarle nelle fasi di
avviamento all'apertura dei dati, personalmente cerco di limitare la
spinta markettara verso l'equivalenza LD=RDF. Ed è anche per questo che,
come faceva notare Irene, non c'è nessun claim LD=RDF sul nostro
lavoro; ma non perchè l'equivalenza sia sbagliata in sè, ma perchè
invece di puntare immediatamente ai Linked ci sono alcuni step
prioritari che possono allargare lo spazio della semantica e favorire la
diffusione sul mercato di modelli Linked diversi dall'RDF. In questo
modo, credo, si può evitare il monopolio di un formato privilegiato e si
permette lo sviluppo di soluzioni sematiche per ogni gusto, uso e
consumo. E si fa crescere la comunità e, auspicabilmente ma non
immediatamente, il mercato. Accordarsi sugli standard serve solamente ad
allineare le amministrazioni su un timing di
rilascio/produzione/pubblicazione dati comune. Se così non fosse, la
possibilità di un mercato dati affidabile sarebbe minata in partenza.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
A questo proposito segnalo che l'INPS ha ora le API online
http://www.inps.it/portale/default.aspx?sID=%3b0%3b7719%3b8567%3b&lastMenu=8567&iMenu=1&iNodo=8567&p4=2&bi=22&link=API%20INPSPotete
anche tirarvi giù un bulk modellato con un approccio piuttosto
sperimentale, ma credo efficacie. Anzi Michele e Irene, vi invito a
farti un giro sui dati. Per esempio, sono sicuro che li a SpazioDati ci
possiate fare qualcosa di vertente e fico ;) Se poi avete bisogno di
qualche chiarimento su questi dati potete contattarmi quando preferite.
Buon divertimento!
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
In
ogni caso grazie moltissimo dei commenti e delle critiche costruttive.
Mi ha fatto molto piacere questo scambio sul tema Linked, specie con voi
due :)
Andrea
Il giorno mercoledì 3 luglio 2013 17:08:33 UTC+2, Michele Barbera ha scritto:
Ciao Andrea,
prima di tutto davvero complimenti per l'ottimo e interessante lavoro!
Visto
che chiedi critiche e che so bene quanto è utile e fa piacere ricevere
feedback, tento una critica (costruttiva) sperando di fare cosa gradita.
Non
capisco quale sia il vantaggio - e anzi mi pare potenzialmente dannoso -
di pubblicare i dati in formato RDF quando in realtà si tratta di una
conversione puramente sintattica. Così lo vedo soltanto come un formato
di serializzazione del CSV come qualsiasi altro, peraltro molto più
difficile da gestire con gli strumenti attuali di un semplice json o
csv.
Mi spiego, una tripla del tipo:
"14"
Non è semanticamente più ricca di:
["record_13", "tonnellate_di_rifiuti_Anno_2002", "14"]
o di qualsiasi altro formato di rappresentazione che possiamo inventarci o che già esiste.
Al
di la delle comprensibili ragioni di marketing, suppongo che l'unico
motivo per cui mi pare possa aver senso fare una cosa del genere sta nel
fatto, che essendo l'architettura del SW a strati, il layer della
semantica (cioè una vera modellazione dei dati) potrebbe essere aggiunto
in un altro momento e magari anche in un altro luogo.
Vero e assolutamente "Web". Ma qual'è il vantaggio di partire da quella rappresentazione e non da qualunque altra?
E dove sta invece lo svantaggio? Perché mi sembra potenzialmente dannoso?
E'
una questione di percezione e di educazione all'uso e al valore dei
Linked Data. Come ha già ricordato Matteo (Brunati), c'è stata una
interessante flame war sulle mailing list linked data del w3c, attorno
al fatto che una errata percezione di cosa significhi Linked Data può
avere degli effetti negativi sul "mercato" (o meglio sulla community).
Se
io, come data provider, erroneamente, faccio l'equivalenza Linked Data =
Semantic Web = RDF e investo nel pubblicare dataset in quella forma,
senza alcun ritorno sulla community, mi convinco e convinco gli
sviluppatori che Linked Data non serve a niente. Inoltre faccio passare
l'erroneo messaggio che basta avere un output in RDF per guadagnarsi la
tanto agognata stellina.
Nota bene che non sono
affatto un talebano dei Linked Data, tant'è che io stesso sto lavorando
in una rappresentazione semplificata del grafo, che *non* usa RDF (e
qui ci penseranno Matteo o Irene a bastonarmi :-) ). Trovo però che
l'aspetto saliente sia quello di aggiungere valore a chi quei dati poi
deve riutilizzarli, altrimenti tanto vale evitare di confondergli le
idee.
Un discorso simile vale per molti (ma non
tutti) dataset "semantici" già pubblicati in vari portali italiani (e
per alcuni non sono, io per primo, privo di colpe :-) ).
Scusa la lungaggine e ripeto, spero che la critica sia costruttiva!
A presto e buon lavoro,
michele
Il giorno mercoledì 3 luglio 2013 12:34:51 UTC+2, Andrea Raimondi ha scritto:
Il giorno mercoledì 3 luglio 2013 12:34:51 UTC+2, Andrea Raimondi ha scritto: