[SOD14, gruppo confiscati bene]: PON sicurezza RDF

51 views
Skip to first unread message

Daniele Del Pinto

unread,
Apr 3, 2014, 5:06:13 AM4/3/14
to spaghett...@googlegroups.com
Ciao a tutti,

purtroppo in questo periodo sono oberato di lavoro ma vi seguo
con interesse e devo dire sincera ammirazione... :-)

In merito alla trasformazione del dataset del pon sicurezza ne posto
una versione fatta con il il plugin RDF di Open Refine fatta al volo
ipotizzando un ipotetico vocabolario 


con le sue property specifiche ed alcun invece prese da rdfs e dcterms.

Lo posto perché quello che mi pare di aver capito da questa esperienza 
è che tutto può essere di "ispirazione" per tutti, spero anche questo piccolo
contributo!

A presto.


00_pon_sicurezza_dettagli-xlsx_v1-5-xls-xls.zip

andy

unread,
Apr 3, 2014, 8:59:07 AM4/3/14
to spaghett...@googlegroups.com
Ciao Daniele,

2014-04-03 11:06 GMT+02:00 Daniele Del Pinto <ddel...@gmail.com>:
purtroppo in questo periodo sono oberato di lavoro ma vi seguo
con interesse e devo dire sincera ammirazione... :-)

come si diceva a scuola (almeno nella mia regione): "specchio!!". Insomma è reciproca :)
 
In merito alla trasformazione del dataset del pon sicurezza ne posto
una versione fatta con il il plugin RDF di Open Refine fatta al volo
ipotizzando un ipotetico vocabolario 


con le sue property specifiche ed alcun invece prese da rdfs e dcterms.

Lo posto perché quello che mi pare di aver capito da questa esperienza 
è che tutto può essere di "ispirazione" per tutti, spero anche questo piccolo
contributo!

Io in questo tema sono imbranato e non capisco subito cosa poterci fare. Ma grazie, grazie, grazie.
Cosa ci possiamo cucinare secondo te con questi ingredienti nuovi che ci hai portato? Immagino qualche spaghetto alla LOD, ma mi fermo agli slogan :)

Grazie ancora




--
Andrea Borruso
website: http://blog.spaziogis.it
GEO+ geomatica in Italia http://bit.ly/GEOplus 
38° 7' 48" N, 13° 21' 9" E, EPSG:4326
--

"cercare e saper riconoscere chi e cosa,
 in mezzo all’inferno, non è inferno, 
e farlo durare, e dargli spazio"

Italo Calvino

Diego Valerio Camarda

unread,
Apr 3, 2014, 9:33:12 AM4/3/14
to spaghett...@googlegroups.com
Ciao Daniele... 

vuoi che ti faccia qualche commento pedante al dataset?

... te lo chiedo perché puoi sempre rispondere che "ci stai lavorando" e allora mi astengo ;)

(WLOD)

----------
Diego Valerio Camarda
dcam...@regesta.com - www.regesta.com


--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.
Per altre opzioni visita https://groups.google.com/d/optout.

Cristiano Longo

unread,
Apr 3, 2014, 10:37:09 AM4/3/14
to spaghett...@googlegroups.com
Caro Daniele, ma con Open Refine si può esportare la configurazione che hai usato per poter replicare l'esperimento?

CL

Daniele Del Pinto

unread,
Apr 3, 2014, 10:54:25 AM4/3/14
to spaghett...@googlegroups.com
no...no... DEVI ASSOLUTAMENTE essere pedante :-)

Daniele Del Pinto

unread,
Apr 3, 2014, 11:08:29 AM4/3/14
to spaghett...@googlegroups.com
Ciao,

apparentemente no, ho anche spulciato tra i metadati del workspace
di Open Refine ma senza risultato.

Se ha già installato il Plugin RDF ti mando 2 schermate e capisci la
semplice configurazione che si deve fare.

Marco Brandizi

unread,
Apr 3, 2014, 3:38:08 PM4/3/14
to spaghett...@googlegroups.com
Ciao Daniele,

il plug-in di RDF di Open Refine può esportare la configurazione, mi pare che quando apri lo skeleton c'è l'opzione (in alto a destra), salva configurazione o qualcosa del genere. L'ho fatto Sabato, durante SOD.
-- 

=========================================================================
Marco Brandizi <marco.b...@gmail.com> 
http://www.marcobrandizi.info

Diego Valerio Camarda

unread,
Apr 3, 2014, 4:38:30 PM4/3/14
to spaghett...@googlegroups.com
Daniele, m'hai provocato...

<pedanteria>

già che hai definito che realizzerai una ontologia, tanto vale inserire una classe per la descrizione delle tue entità 
potrebbe diventare
<rdf:type rdf:resource="http://data.pon.it/onto/pon/Progetto"/>
questo ti permetterebbe di avere lo spazio per spiegare a noi mortali 'cavolo è un progetto pon

io preferisco molto di più usare dc invece che dcterms per quelle proprietà che elevano da sole l'iteroperabilità del tuo dataset di 100 punti
<dcterms:title>Videosorveglianza nei Comuni di Castelvolturno e Casal di Principe</dcterms:title>
diventerebbe 
<dc:title>Videosorveglianza nei Comuni di Castelvolturno e Casal di Principe</dc:title>

quando punti ad URI (URL) ti conviene sempre usare @rdf:resource piuttosto che i nodi testo, questo per fare in modo che vengano rappresentate come object properties (cosa che in effetti sono)
diventerebbe

i decimali vanno bene, ma according to http://www.w3.org/TR/xmlschema-2/, ti converrebbe togliere i punti tra le cifre intere per evitare ambiguità e userei il punto al posto della virgola
<pon:finanziamento rdf:datatype="http://www.w3.org/2001/XMLSchema#decimal">349.500,00</pon:finanziamento>
diventerebbe 
<pon:finanziamento rdf:datatype="http://www.w3.org/2001/XMLSchema#decimal">349500.00</pon:finanziamento>

attenzione alle date, dovrebbero consentire un facile ordinamento (anche se trattate come stringhe) ed esser comprensibili ad un anglofono, in pratica fai sempre riferimento a http://www.w3.org/TR/xmlschema-2
<pon:approvazione rdf:datatype="http://www.w3.org/2001/XMLSchema#date">26-04-2012</pon:approvazione>
diventerebbe
<pon:approvazione rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2012-04-26</pon:approvazione>

per i luoghi non c'è da inventare nulla, chiaramente sarebbe bello poter puntare a dataset esterni (5 stelle!!) e recuperare le coordinate geospaziali (non è complicato) e magari anche arricchire di significato le proprietà (che ruolo hanno questi luoghi nei tuoi dati? ora non si capisce), in generale si potrebbe passare da
<pon:comune>Grumo Appula</pon:comune>
<pon:provincia>Bari</pon:provincia>
<pon:regione>Puglia</pon:regione>
a qualcosa tipo
<pon:areaIntevento>
   <!-- magari più che Town potresti mettere Suburb vedi qui, l'allineamento ti aiuterebbe in questo, al massimo pure Place, ma la classe fornisce qualche info in più per l'analisi -->
      <geo:lat>rubato magari a dbpedia o linkedgeodata</geo:lat>
      <geo:long>anche un furto da qualche altro sistema geo, ma per questo non chiedere a me, in lista c'è chi ne sa di più</geo:long>
      <dc:title>Grumo Appula</dc:title>
      <lgdo:isIn>Bari, Puglia</lgdo:isIn>
      <!-- anche qui potresti riferirti ad entità e non a stringhe (o a entrambe per comodità di lettura e accesso) --> 
  </lgdo:Town>
considera che se per ogni record ripeti informazioni ridondanti (ripetendo entità che già hai prodotto durante l'estrazione) non è un problema perché l'about del luogo è univoco ed alla fine quando pubblichi in un endpoint tutto si riconcilia e i doppioni vengono scartati

è altamente sconsigliabile inserire in una stessa proprietà valori differenti per natura:
<pon:conclusione>progetto in corso</pon:conclusione>
e
<pon:conclusione>08-01-2010</pon:conclusione>
chiaramente per 
<pon:conclusione>08-01-2010</pon:conclusione>
conviene 
<pon:conclusione rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2010-01-08</pon:conclusione>


</pendateria>


perdonami per tutto questo ;)

ps
per chiudere: non avendo tu il dominio http://data.pon.it conviene che utilizzi una Purl (o qualche servizio analogo)
ed infine: se quando hai finito vuoi pubblicare tutto questo su di un endpoint, chiedi pure a me che te lo pubblico da noi

a presto,
diego


per chiudere...

VIVA, VIVA I LINKEDDATA

----------
Diego Valerio Camarda
dcam...@regesta.com - www.regesta.com


Cristiano Longo

unread,
Apr 3, 2014, 4:48:48 PM4/3/14
to spaghett...@googlegroups.com
On 03/04/2014 22:38, Diego Valerio Camarda wrote:
per i luoghi non c'è da inventare nulla, chiaramente sarebbe bello poter puntare a dataset esterni (5 stelle!!) e recuperare le coordinate geospaziali (non è complicato) e magari anche arricchire di significato le proprietà (che ruolo hanno questi luoghi nei tuoi dati? ora non si capisce), in generale si potrebbe passare da
<pon:comune>Grumo Appula</pon:comune>
<pon:provincia>Bari</pon:provincia>
<pon:regione>Puglia</pon:regione>
a qualcosa tipo
<pon:areaIntevento>
   <!-- magari più che Town potresti mettere Suburb vedi qui, l'allineamento ti aiuterebbe in questo, al massimo pure Place, ma la classe fornisce qualche info in più per l'analisi -->
      <geo:lat>rubato magari a dbpedia o linkedgeodata</geo:lat>
      <geo:long>anche un furto da qualche altro sistema geo, ma per questo non chiedere a me, in lista c'è chi ne sa di più</geo:long>
      <dc:title>Grumo Appula</dc:title>
      <lgdo:isIn>Bari, Puglia</lgdo:isIn>
      <!-- anche qui potresti riferirti ad entità e non a stringhe (o a entrambe per comodità di lettura e accesso) --> 
  </lgdo:Town>
Stavo iniziando a vedere geonames ontology. Non può sostituire lgdo, ma contiene invece la gerarchia comune -> provincia -> regione -> stato ...

In generale, vi sembra una buona idea?

Per ricavare le coordinate dall'indirizzo vi impasto una funzione che ho scopiazzato tempo addietro dalla documentazione d google  maps.

/**
 * Retrieve a point [lat,long] from an address.
 * Return a string lat,long, or null if geocoding failed.
 **/
function retrievePoint($address){
    /*
     * Code taken from
     * http://code.google.com/intl/it-IT/apis/maps/articles/phpsqlgeocode.html#geocodephp
     */
    $request_url = "http://maps.google.com/maps/geo?output=xml&q=" . urlencode($address);
    $xml = simplexml_load_file($request_url) or die("url not loading");
    $status = $xml->Response->Status->code;
    if (strcmp($status, "200") == 0)
        return $xml->Response->Placemark->Point->coordinates;
    return null;
}

andy

unread,
Apr 3, 2014, 4:53:47 PM4/3/14
to spaghett...@googlegroups.com
Ciao,

2014-04-03 22:48 GMT+02:00 Cristiano Longo <cristia...@gmail.com>:
Stavo iniziando a vedere geonames ontology. Non può sostituire lgdo, ma contiene invece la gerarchia comune -> provincia -> regione -> stato ...

entro in punta di piedi in questo mondo  LOD e segnalo una cosa che probabilmente conoscerete tutti: http://geowordnet.semanticmatching.org/


Daniele Del Pinto

unread,
Apr 3, 2014, 4:54:54 PM4/3/14
to spaghett...@googlegroups.com
ahahaha.... bellissimo sei un professionista
della pedanteria!!! tutto quello che ho capito
lo condivido, quello che non ho ben capito spero
di chiarirmelo a breve... ti farò delle domande
;-)

grazie

Diego Valerio Camarda

unread,
Apr 3, 2014, 5:13:58 PM4/3/14
to spaghett...@googlegroups.com
@Cristiano, in effetti hai ragione, dal punto di vista dell'ontologia Geonames è fatta in qualche modo "meglio" per quanto concerne le gerarchie... uso linkedgeodata "ibridata" con quella per avere parentADM1, parentADM2, la questione è un'altra: 

OSM -> LGDO -> SOD LOVE OSM -> LGDO IS BETTER THEN GN -> :)

a parte gli scherzi, lgdo contiene anche oggetti molto specifici, come le fontanelle (a qualcuno fischiano le orecchie?), mentre geonames no, inoltre geonames non ha lo SPARQL enpoint ed io mi annoio a dover imparare una sintassi di accesso per ogni API che mi mettono a disposizione

@Andrea, geoworldnet non fornisce un accesso SPARQL online e quindi non saprei propro dirti... non mi va di scaricare i 344MB di dati solo per farmici un giro sopra
comunque in realtà non lo conosco, devo approfondire


ps
come qualcuno avrà notato anche a SOD14 sto cercando di far diventare la parola SPARQL popolare in lista... anche se la vedo molto dura



----------
Diego Valerio Camarda
dcam...@regesta.com - www.regesta.com


--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.
Per ulteriori opzioni, visita https://groups.google.com/d/optout.

andy

unread,
Apr 3, 2014, 5:17:24 PM4/3/14
to spaghett...@googlegroups.com

2014-04-03 23:13 GMT+02:00 Diego Valerio Camarda <dcam...@regesta.com>:
@Andrea, geoworldnet non fornisce un accesso SPARQL online e quindi non saprei propro dirti... non mi va di scaricare i 344MB di dati solo per farmici un giro sopra
comunque in realtà non lo conosco, devo approfondire

Lo so, ma l'ho segnalato perché è semanticamente più forte di geonames, e perché magari qualcuno non lo conosceva ;)

Diego Valerio Camarda

unread,
Apr 3, 2014, 5:19:03 PM4/3/14
to spaghett...@googlegroups.com
ed infatti mi hai colto impreparato :)

----------
Diego Valerio Camarda
dcam...@regesta.com - www.regesta.com


--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.

Tommaso Di Noia

unread,
Apr 4, 2014, 9:36:40 AM4/4/14
to spaghett...@googlegroups.com
Già che ci sei, per le città, provincie etc usa dbpedia, dbpedia-it e se ti va anche freebase. Diversamente resti ad un dataset rdf a 4 stelle che è cool ma non parla molto con il resto del mondo.
Es:
http://dbpedia.org/resource/Grumo_Appula
http://dbpedia.org/resource/Province_of_Bari
http://it.dbpedia.org/resource/Grumo_Appula
http://rdf.freebase.com/ns/m.0fw_nx
ecc..
Così vai a 5 stelle.

Non aver paura di essere ridondante e di chiamare la stessa cosa con URI diversi. In questo caso, la ridondanza fa bene all'integrazione. Non tutti seguono gli owl:sameAs (escluso LODlive ovviamente)

Poi per i progetti potresti dire che sono di tipo http://xmlns.com/foaf/0.1/Project.  In ogni caso in FOAF ci sono un po' di elementi per descrivere dei progetti.
Se puoi vuoi proprio esagerare usa anche la DUL ontology (www.ontologydesignpatterns.org/ont/dul/DUL.owl)

@Diego: SPARQL SPARQL SPARQL SPARQL SPARQL SPARQL SPARQL SPARQL SPARQL SPARQL SPARQL SPARQL

Marco Brandizi

unread,
Apr 4, 2014, 8:11:49 PM4/4/14
to spaghett...@googlegroups.com

On 03/04/2014 22:38, Diego Valerio Camarda wrote:

io preferisco molto di più usare dc invece che dcterms per quelle proprietà che elevano da sole l'iteroperabilità del tuo dataset di 100 punti
<dcterms:title>Videosorveglianza nei Comuni di Castelvolturno e Casal di Principe</dcterms:title>
diventerebbe 
<dc:title>Videosorveglianza nei Comuni di Castelvolturno e Casal di Principe</dc:title>

La cosa è un po' complicata: http://wiki.dublincore.org/index.php/FAQ/DC_and_DCTERMS_Namespaces
In sostanza, dcterms:title è più preciso di dc:title, perché la prima specifica che il range è costituito dai Literal, la seconda, per motivi di retro-compatibilità, non specifica niente. Non so se usare dcterms: sia meno interoperabile (è comunque una estensione di dc:), temo di sì...

Ciao,

Diego Valerio Camarda

unread,
Apr 5, 2014, 3:43:44 AM4/5/14
to spaghett...@googlegroups.com
Marco, io ne facevo solo una questione di quantità di persone che la usano... Diciamo una maggiore interoperabilità 'di fatto' più che 'di concetto'

Noi quando pubblichiamo linked opendata in genere inseriamo due volte lo stesso titolo, una volta in dc:title e una volta in rdfs:label, solo per permettere a chi non conosce il dataset di accedere con più facilitá. (Alla faccia delle ottimizzazioni, della verbosità e della ridondanza!!)
--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.
Per altre opzioni visita https://groups.google.com/d/optout.


--
-------
Diego Valerio Camarda
(Inviato da Gmail Mobile)

Marco Brandizi

unread,
Apr 5, 2014, 5:00:34 AM4/5/14
to Spaghetti Open Data

On 5 Apr 2014 09:43, "Diego Valerio Camarda" <dcam...@regesta.com> wrote:

>
> Noi quando pubblichiamo linked opendata in genere inseriamo due volte lo stesso titolo, una volta in dc:title e una volta in rdfs:label, solo per permettere a chi non conosce il dataset di accedere con più facilitá. (Alla faccia delle ottimizzazioni, della verbosità e della ridondanza!!)
>

Infatti puro io :-) Quando c'ho tempo mi vado a vedere quante volte è usato l'uno e l'altro...

Reply all
Reply to author
Forward
0 new messages