Produzione Linked OpenData

127 views
Skip to first unread message

Michele Mondelli

unread,
Dec 17, 2014, 7:46:01 AM12/17/14
to spaghett...@googlegroups.com
Salve a tutti.

La società per la quale lavoro si sta occupando di sviluppare un software che affianchi e semplifichi tutto il processo di gestione degli OpenData.

Sto cercando di capire quale sia la strategia migliore per generare LOD di alta/ottima qualità.
Ho l'impressione che sul tema le indicazioni dell'AgID siano molto vaghe.

In particolare, quello che vorrei capire si può riassumere in due punti:
  1. come e quali ontologie scelgo per i miei dati?
  2. quale livello di specificità devo raggiungere nei dati, e a che punto invece devo lasciare che le informazioni siano inferite da altri livelli?
Cerco di spiegarmi.
Quando mi trovo ad esempio a creare LOD delle strade di un comune, che ontologia scelgo per la parola "Strada"?
Ho visto che il Comune di Bologna ha creato una propria ontologia¹ per quasi tutti i termini dei dataset rilasciati.
Ma questo non va contro i principi stessi dei LOD, impedendo un corretto linking a livello nazionale e/o europeo?
Una possibile ipotesi era di utilizzare il valore dall'ontologia di DBpedia². Può andare bene secondo voi?
A questa domanda se ne collega un'altra: come cerco un termine per capire se è già stato definito da altri? 
Esistono molti Semantic Web Search Engines, ma con risultati diversi e complessi. 
Una cosa che mi sembra manchi sicuramente, da parte dell'AgID, è l'indicazione di un set di ontologie da utilizzare per gli scenari più comuni (leggi: dataset strategici).

Per quanto riguarda invece il grado di specificità del dato, riprendo l'esempio di prima della strada.
Nel caso dell'ontologia di DBpedia, tra le proprietà disponibili ce ne sono molte, tra cui ad esempio il CAP.
Devo assegnare questa proprietà ad ogni strada? O questa informazione dovrebbe essere inferita direttamente dall'utente cercando il CAP della città a assegno la strada?

Spero di essere stato il più chiaro possibile, nel caso mi scuso per mie evidenti lacune/errori. 


Grazie in anticipo,


Matteo Brunati

unread,
Dec 17, 2014, 7:59:41 AM12/17/14
to spaghett...@googlegroups.com

A questa domanda se ne collega un'altra: come cerco un termine per capire se è già stato definito da altri? 

cristiano longo

unread,
Dec 17, 2014, 8:17:41 AM12/17/14
to spaghett...@googlegroups.com
Vedi questo articolo sul lavoro fatto riguardo al comune di Catania dall'STLab

Sergio ConsoliAldo GangemiAndrea Giovanni NuzzoleseSilvio PeroniValentina PresuttiDiego Reforgiato RecuperoDaria Spampinato:Geolinked Open Data for the Municipality of Catania. WIMS 2014: 58

Non esitare a contattarli, oppure a contattare me. 

--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.
Per altre opzioni visita https://groups.google.com/d/optout.

Michele Mondelli

unread,
Dec 17, 2014, 12:05:36 PM12/17/14
to spaghett...@googlegroups.com
Ciao Cristiano.

Il giorno mercoledì 17 dicembre 2014 14:17:41 UTC+1, cristiano longo ha scritto:
Vedi questo articolo sul lavoro fatto riguardo al comune di Catania dall'STLab

Sergio ConsoliAldo GangemiAndrea Giovanni NuzzoleseSilvio PeroniValentina PresuttiDiego Reforgiato RecuperoDaria Spampinato:Geolinked Open Data for the Municipality of Catania. WIMS 2014: 58
 
Ho letto con molto interesse l'articolo, che chiarisce la metodologia da utilizzare e integra in qualche modo le linee guida dell'AgID sui LOD.
Io ho fatto un lavoro simile, utilizzando D2R¹ per tirare fuori i dati dal nostro database PostgreSQL e generare automaticamente una prima ontologia.
A quel punto ho lavoraro sul file di raccordo tra database e linked data per migliorare la traduzione, introdurre il linking con URI di altri oggetti del database, ecc.

Per citare un punto del lavoro che mi hai consigliato, nell'ontologia creata si definisce la classe NumeroCivico². 
Anche nel lavoro fatto dal Comune di Bologna viene definita una classe NumeroCivico³. 
Questo non rende "inutile" in un certo senso il lavoro? Non potrò mettere insieme i dati, in quanto le definizioni sono diverse.

Rispondo anche a Matteo.
Avevo trovato quell'ottimo repository in rete, ma la mia domanda non è "come trovare le classi", ma "come capisco quale utilizzare, per far si che i miei LOD siano della migliore qualità possibile?"


Saluti,
  Michele

Cristiano Longo

unread,
Dec 17, 2014, 1:04:40 PM12/17/14
to spaghett...@googlegroups.com, sergio Consoli, Aldo Gangemi, valentina presutti
On 17/12/2014 18:05, Michele Mondelli wrote:
Ciao Cristiano.

Il giorno mercoledì 17 dicembre 2014 14:17:41 UTC+1, cristiano longo ha scritto:
Vedi questo articolo sul lavoro fatto riguardo al comune di Catania dall'STLab

Sergio ConsoliAldo GangemiAndrea Giovanni NuzzoleseSilvio PeroniValentina PresuttiDiego Reforgiato RecuperoDaria Spampinato:Geolinked Open Data for the Municipality of Catania. WIMS 2014: 58

....

Per citare un punto del lavoro che mi hai consigliato, nell'ontologia creata si definisce la classe NumeroCivico². 
Anche nel lavoro fatto dal Comune di Bologna viene definita una classe NumeroCivico³. 
Questo non rende "inutile" in un certo senso il lavoro? Non potrò mettere insieme i dati, in quanto le definizioni sono diverse.


Dovrei studiare un po meglio le due definizioni, in teoria la discrepanza si potrebbe risolvere "a posteriori" mediante l'utilizzo di un reasoner. Metto in copia alcuni degli autori dell'articolo.

Nicola Ghirardi

unread,
Dec 17, 2014, 1:32:54 PM12/17/14
to spaghett...@googlegroups.com, sergio....@istc.cnr.it, aldo.g...@gmail.com, valentina...@cnr.it
Se non sbaglio il comune di Bologna ha prodotto anche mapping tra la sua ontologia e quelle standard, approccio valido dal mio punto di vista, sopratutto quando non esiste un singolo standard di fatto per i dati che si stanno pubblicando.

Diego Valerio Camarda

unread,
Dec 17, 2014, 2:14:50 PM12/17/14
to spaghett...@googlegroups.com
ragazzi scusate, ma il problema è diverso...

non esiste una soluzione buona per principio, possiamo di sicuro identificare delle soluzioni mediocri, ma di sicuro a questa richiesta di Michele non si può dare una risposta esaustiva

la questione che bisogna analizzare è: che dati devi pubblicare? 

se stai facendo un dataset, una tantum, non inserito in nessun progetto organico di pubblicazione di un dato dominio di conoscenza, allora ti consiglio di usare ontologie di altri, schema.org, dbpedia (anche se eviterei) o qualunque altra cosa che magari trovi già fatta così da aumentare il livello di interoperabilità del tuo dato finale 

se invece stai facendo un discorso più organico magari con una PA, devi prendere in considerazione il suo dominio di conoscenza, quali saranno i dataset che pubblicheranno in futuro in LOD e come questi verranno integrati tra di loro per produrre un unico dataset, allora sì che puoi affrontare la stesura di una ontologia specifica, con caratteristiche specifiche e mapping verso altre ontologie, così che crawlers e reasoners siano in grado di estrarre una maggior conoscenza dai dati pubblicati


pubblicare LOD non significa adottare un formato di serializzazione, significa concettualizzare ed integrare fonti e risorse

occhio che D2RQ per soluzioni molto semplici può funzionare... in domini complessi proprio no


ciao a tutti!


----------
Diego Valerio Camarda
dcam...@regesta.com - www.regesta.com

Matteo Brunati

unread,
Dec 17, 2014, 5:12:25 PM12/17/14
to spaghett...@googlegroups.com


pubblicare LOD non significa adottare un formato di serializzazione, significa concettualizzare ed integrare fonti e risorse



questa è da incorniciare: ci faccio una maglietta :)

@all:
scusate per la risposta veloce di stamattina, ma "Christmas is coming", e la questione che hai postato Michele, è davvero impossibile da rispondere, se non con quello che ha già detto Diego. +1000.

Una cosa collegata la vorrei approfondire, ma più a livello generale, quando si dice:

"La società per la quale lavoro si sta occupando di sviluppare un software che affianchi e semplifichi tutto il processo di gestione degli OpenData."

noto due cose:
  1. da open data si è passati ad un processo che genera LOD: non male come step logico :) ma la tecnologia è abilitante e la LOD è roba più M2M, prima di tutto. Occhio a non perdersi il processo più ampio di governance del dato. Lo riassume bene Giovanni Menduni su Chefuturo, anche se su un dominio diverso.[1]
  2. il passaggio di cui parli è uno step che si deve incanalare tra legami di design top-down, ovvero da Agid, e cose a scala più piccola, e potenzialmente comunale. E qui siamo ad un compromesso storico. Ad oggi non puoi avere nessuna certezza: dipende dal tuo dominio, ma per fortuna poi tutto è collegabile, anche a livello di classi e di schemi. Per cui ci vuole buon senso e rifarsi ai casi citati che hanno già affrontato il tema. La LOD di Matera è un ottimo punto di partenza :)
    1. su questo consiglio pag.3 di Nodalities number.5[2] e pag.9 del numero 1, con Tim Berners Lee che spiega indirettamente anche questo step.[3] Giusto come revival :)

Poi un ping a Tommaso Di Noia, ad esempio, per un suo punto di vista ci starebbe tutto... Quale è stato l'approccio di Matera su questa complessità?

 matt


[1] - http://www.chefuturo.it/2014/11/expo-2015-perche-abbiamo-aiutato-a-liberare-i-dati-e-perche-da-oggi-li-studiamo-insieme/

[2] - https://github.com/beauvais/nodalities/blob/master/nodalities_issue5.pdf

[3] - https://github.com/beauvais/nodalities/blob/master/nodalities_april.pdf


fralu

unread,
Dec 22, 2014, 12:21:34 PM12/22/14
to spaghett...@googlegroups.com
Potrebbe essere utile fare una visitina da JOINUP  (gruppo SEMIC)

https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas

e scaricare il cookbook
https://joinup.ec.europa.eu/sites/default/files/49/c3/81/Cookbook%20for%20translating%20relational%20domain%20models%20to%20RDF-S.pdf


Contiene delle  risposte interessanti  alle domande di cui sopra.
Ciao

Tommaso Di Noia

unread,
Dec 29, 2014, 11:05:43 AM12/29/14
to spaghett...@googlegroups.com
Rispondo con un po' di ritardo.
Per i LOD di Matera abbiamo:
- Creato una descrizione per le entità principali che andavamo a rappresentare: nella sua versione attuale le chiese rupestri e, appena possibile, tutti i beni culturali, gli eventi, gli esercizi commerciali e attività ricettive.
- Successivamente per strutturare il vocabolario (o ontologia se preferite) e dare i nomi alle proprietà con relativi domain e range abbiamo visto cosa c'era in giro di già definito. Per questo task il servizio LOV citato prima da Matteo si è rivelato molto utile in tantissime occasioni... ma anche Google/Bing non sono male ;-) Abbiamo privilegiato le proprietà di schema.org e di DBpedia.
- Nelle situazioni in cui per una proprietà abbiamo trovato più candidati, abbiamo inserito nell'ontologia delle relazioni di equivalentProperty in modo da rendere il dataset quanto più interoperabile possibile con altri dataset. Ad esempio per http://schema.org/image nella nostra ontologia abbiamo quello che c'è poco più in basso (copy/paste dal file OWL generato da Protege). In fase di creazione dei dati, le relazioni di equivalenza tra proprietà possono essere usate in maniera esplicita denormalizzando tutto o lasciare tutto in maniera implicita in modo che sia il riagionatore associato all'eventuale motore SPARQL ad occuparsi di tutto.

    <!-- http://schema.org/image -->
    <owl:ObjectProperty rdf:about="&schema;image">
        <rdfs:label xml:lang="en">image</rdfs:label>
        <rdfs:label xml:lang="it">immagine</rdfs:label>
        <rdfs:comment xml:lang="en">The property refers to the URL of the image of the resource</rdfs:comment>
        <rdfs:comment xml:lang="it">La proprietà si riferisce all&#39;URL dell&#39;immagine della risorsa</rdfs:comment>
        <rdfs:domain rdf:resource="&lodmt;CulturalHeritage"/>
        <owl:equivalentProperty rdf:resource="&schema;photo"/>
        <owl:equivalentProperty rdf:resource="&foaf;depiction"/>
    </owl:ObjectProperty>
 
- Anche per la definizione di domain e range abbiamo cercato di usare quanto più possibile delle classi presenti in ontologie già condivise e diffuse sul Web. Anche in questo caso, ove necessario abbiamo introdotto delle relazioni di equivalentClass.
- Una volta definita l'ontologia, il popolamento dei dati è stato fatto cercando di riusare quanto più possibile gli URI presenti sul Web per l'identificazione delle entità. In questo è tornato molto utile aver definito come range delle classi già presenti ad esempio nella DBpedia Ontology.
- Infine, ciliegina sulla torta, siamo andati a caccia di relazioni di sameAs ed abbiamo inserito la tripla corrispondente. Vedi ad esempio http://dati.comune.matera.it/lod/page/Cripta_del_Cristo

Concludo con una segnalazione (@ Andrea Maurino. Ho messo tutto online ;-) ). Al Politecnico di Bari stiamo sviluppando un tool per gestire LOD à la Wikidata. Per ogni risorsa viene data la possibilità di fare editing sulle proprietà, aggiungerne di nuove, aggiungere traduzioni ecc. Il tutto guidato da una ontologia precaricata. Siamo in fase pre-beta e presto lo metteremo su github. Mi piacerebbe  che ci giocaste un po' in modo da avere possibili feedback, critiche, stroncature. Il mio sogno a lungo termine è quello di farlo diventare un CMS che abbia un backend che sia esclusivamente basato su triple e che sia tutto esposto in LOD. Insomma content negotiation a manetta!

Una installazione è presente all'indirizzo http://193.204.59.23/
Non c'è ancora un manuale ma spero che le funzionalità siano autoesplicative. Ci sono caricati i dati di LOD Matera per giocarci un po'. Create pure il vostro account. Vi arriverà una mail dal dominio x-lod.org, controllate lo spam se non arriva
Enjoy!

P.S. se qualcuno ha voglia di contribuire è molto più che benvenuto!

Alessio Dragoni

unread,
Dec 29, 2014, 11:24:13 AM12/29/14
to spaghett...@googlegroups.com
complimenti Tommaso!

ti segnalo una lingua "anomala" nel form di registrazione che ti consiglio di togliere prima che scoppi un putiferio con i partenopei!!!

ciao e direi proprio che il 2015 promette proprio bene per Matera e tutta la Puglia !!!

ciao
Alessio
--

Diego Valerio Camarda

unread,
Dec 29, 2014, 11:29:50 AM12/29/14
to spaghett...@googlegroups.com
grande tommaso!

due cose: 
1. modifica le lingue come dice alessio... al più presto
2. non mi funziona la registrazione ;) con chrome:

registration.js:21 fail
registration.js:22 409


ciao!!!

ps



----------
Diego Valerio Camarda
dcam...@regesta.com - www.regesta.com

Francesco Piero Paolicelli

unread,
Dec 29, 2014, 12:47:26 PM12/29/14
to spaghett...@googlegroups.com
Occhio che Matera è Basilicata :) 

Inviato da iPhone

Alessio 'Blaster' Biancalana

unread,
Dec 29, 2014, 1:14:03 PM12/29/14
to spaghett...@googlegroups.com

Seh vabbeh adesso vienici pure a dire che esiste il Molise...

:-D

Ale
Inviato da Android

Alessio Dragoni

unread,
Dec 29, 2014, 3:30:47 PM12/29/14
to spaghett...@googlegroups.com

hahaha... eccerto Piersoft!
con il "tutta la Puglia" mi riferivo al coinvolgimento dell'Univ. di Bari e le iniziative a Lecce e della Regione Puglia...

Francesco Piero Paolicelli

unread,
Dec 29, 2014, 6:07:27 PM12/29/14
to spaghett...@googlegroups.com
:)

Comunque magari riuscissimo a trovare leve nella Regione Puglia. 
Ci stiamo provando ma non è semplice.
Regione Basilicata più o meno siamo partiti. Ma in Puglia ci sono dinamiche complesse 

Inviato da iPhone

Tommaso Di Noia

unread,
Dec 30, 2014, 7:35:20 AM12/30/14
to spaghett...@googlegroups.com
Mi scuso ufficialmente con tutti gli amici partenopei. Il solito tesista idiota che pensava di essere simpatico... e che credo resterà tesista per un bel po' 😊
Correggo appena accedo ad un pc

Tommaso Di Noia

unread,
Dec 30, 2014, 1:52:57 PM12/30/14
to spaghett...@googlegroups.com
grazie diego

1. Fatto. Sorry again
2. Lo guardo appena ho un po' di tempo (leggi dopo la Befana)

Avevo già visto il tuo lodview e devo dire che, ancora una volta, è una gran cosa. BRAVO!

Noi stiamo modificando pubby per renderlo più interessante ed un po' più flessibile. Stiamo lavorando sulle seguenti cose:
- associare un template diverso a seconda della classe di appartenenza della risorsa (sempre in ottica CMS). Pubby usa velocity per i template. Stiamo lavorando su quello. Considera che adesso LOD Matera usa pubby con un template diverso da quell'orribile verdino.
-  mostrare la label della proprietà invece dell'IRI. Vedere "titolo" invece di dcterms:title secondo me è meglio. Potresti farlo anche tu su lodview. Inoltre, sotto la label mostriamo gli IRI di tutte le proprietà equivalenti.

Andrea Maurino

unread,
Dec 30, 2014, 2:15:44 PM12/30/14
to spaghett...@googlegroups.com

sulle problematiche di produzione  lod qualche ulteriore riflessione e risultati della letteratura scientifica sono in uno dei deliverable del progetto comsode [1]

@tommaso grazie della segnalazione per il tool. magari si potrebbe usarlo a valle del tool unified view (www.unifiedview.eu) per l'improvment dei dati lod

@alessio da pugliese spero che la mia regione si renda più attiva (e da tarantino vorrei vedere i dati arpa puglia!). se posso aiutare in qualche maniera, sono a disposizione

Andrea
[1]http://www.comsode.eu/wp-content/uploads/D5.2_Methodology_for_deployment_and_usage_COMSODE_publication_platform_ODN.pdf

Diego Valerio Camarda

unread,
Jan 3, 2015, 1:05:24 PM1/3/15
to spaghett...@googlegroups.com
@Andrea www.unifiedview.eu non risulta online, ho cercato al volo ma senza successo, cosa è?

@Tommaso

>>> - associare un template diverso a seconda della classe di appartenenza della risorsa (sempre in ottica CMS). Pubby usa velocity per i template. Stiamo lavorando su quello. Considera che adesso LOD Matera usa pubby con un template diverso da quell'orribile verdino.

questo per come ho impostato io le cose sarebbe alquanto facile... siete andati molto avanti a modificare pubby? altrimenti fammi un fischio ;)

>>> -  mostrare la label della proprietà invece dell'IRI. Vedere "titolo" invece di dcterms:title secondo me è meglio. Potresti farlo anche tu su lodview. Inoltre, sotto la label mostriamo gli IRI di tutte le proprietà equivalenti.

in linea di massima sì, mettere la label potrebbe essere più accattivante... detto questo però l'uso dei titoli che è stato fatto online è alquanto variegato (se penso a dbpedia ne trovo di lunghi, corti, inutili, errati...) e su lodview.it questo avrebbe degli effetti disastrosi, per ora sto sviluppando un branch su github con un tooltip che mostra label e comment per ogni proprietà e posso impostare una modalità "very human" per attivare le etichette come dici tu (ma solo nella versione per il download ed il riuso sui propri dati), ora che mi ci fai pensare mi sto interrogando sulle proprietà... dici che aggiungono molto al "significato" dal punto di vista di un essere umano? Devo fare delle prove su dati reali...

----------
Diego Valerio Camarda
dcam...@regesta.com - www.regesta.com

Andrea Maurino

unread,
Jan 7, 2015, 4:19:33 AM1/7/15
to spaghett...@googlegroups.com

@diego... ops

www.unifiedviews.eu

ciao

Nicola Ghirardi

unread,
Jan 7, 2015, 8:37:43 AM1/7/15
to spaghett...@googlegroups.com
Complimenti per il bel lavoro Tommaso and Team!
Mancava uno strumento di questo tipo! Mi ha fatto tornare in mente semanticWiki, più l'idea della realizzazione per fortuna :)
I tool "Belli&Buoni" madeInItaly iniziano ad essere tanti, perchè non integrarli? #sod15
PS. Aspettiamo il github! ;)
Reply all
Reply to author
Forward
0 new messages