Cari Giorgia e Raffaele,vi relaziono un primo lavoro svolto, relativo alle inferenze semantiche ed uso di ontologie, partendo dai dati aperti su dati.gov.it, classificati come ambiente, in tema di rifiuti.Il mio input e' stato il seguente:Tale input consiste nell'insieme dei csv classificati come ambiente, e trovati con la search "rifiuti".Ho importato tutti i csv che non davano errori di importazione, e li ho caricati in un file access che allego, di nome rifiuti28.mdbOgni tabella importata da csv, e' stata manipolata per ottenere solo le colonne di interesse per le inferenze, ovvero:nome tavola, descrizione tavola, nome campo, descrizione campo.Laddove mancante la descrizione tavola, e' stata resa uguale a nome tavola.Laddove mancante la descrizione campo, e' stata resa uguale a nome campo.Sono stati presi quindi i metadati di ciascuna tavola.Per i campi alfanumerici, sono stati presi anche i valori di dominio, ovvero i dati e non solo i metadati.Con un esempio: se tratto il campo colore, puo' essere interessante inferire conoscenza anche dai suoi valori alfanumerici (bianco, rosso, eccetera).Ciascuna tavola manipolata e' stata copiata in una unica tavola denominata f1, che contiene metadati e dati di tutte le tavole manipolate, e ha il seguente formato:id progressivo, nome database, nome tavola, descrizione tavola, nome campo, descrizione campoIl tutto e' confluito nel db rifiuti28ontologia.mdb allegato.Infine, la sola tabella f1 e' confluita nel database del tool che uso per le inferenze, si chiama db.mdb e lo allego:Facendo girare i tools (che allego: eseguibile da lanciare: progettocsi.exe)si ottengono 3 frammenti di ontologia (i files *.txt che allego).Si accede al seguente web service:dando in input i rispettivi txt allegati (usage=attributes).Si ottiene in output il file con estensione owl in allegato.A sua volta tale file diventa l'input per un web service che disegna l'owl allegata:Un paio di considerazioni:1) le ontologie di riferimento che ho usato sono quelle ottenute, a suo tempo da Carlo Batini, dalle gerarchie di generalizzazione delle 4 entita' fondamentali della p.a. (soggetto, bene, documento, luogo geografico). Di tali gerarchie si sfruttano le relazioni a livello piu' alto. Non ho al momento a disposizione ontologie relative ai rifiuti. E' possibile introdurre nuove ontologie (dei rifiuti, nello specifico, o qualsivoglia altre per materia) nel tool ed arricchire le inferenze.2) i tool sono in grado di arricchire dal basso le ontologie di riferimento, utilizzando i constraints fisici dei database. Cosa impossibile da fare in automatico reversando strutture csv di opendata. Cosa che sarebbe possibile se si partisse dalle strutture (ddl sql scripts) dei db operazionali, ecco perche' insisto (in altre mie richieste a voi come DAF) per poter lavorare sulle strutture dei db fonte.Prossimamente conto di aumentare l'input, partendo dalla sola search "rifiuti", senza tener conto della classificazione ambiente:L'inferenza applicata su una maggior quantita' di dati e metadati puo' incrementare le inferenze stesse.Avrei bisogno di sapere se posso usare questi esperimenti, quelli di questa email in particolare, per scrivere un articolo che parli di questi primi esperimenti, e pubblicarlo da parte di Alessandro Longo.Attendo vostre risposte e suggerimenti, richieste di chiarimenti e quant'altro sia per voi necessario sapere.Scusate per l'approccio dettagliato e necessariamente tecnico.Vi ringrazio.A presto.Riccardo Grosso.Il giorno 23 marzo 2017 12:09, Giorgia Lodi <giorgi...@gmail.com> ha scritto:---------- Messaggio inoltrato ----------
Da: Riccardo Grosso <riccardo.maria.grosso@gmail.com>
Date: 22 marzo 2017 15:55
Oggetto: primi passi
A: Lodi Giorgia <giorgi...@agid.gov.it>Ciao Giorgia,comincero' con un reverse engineering dal fisico partendo dai seguenti datasets:A prestoRic--Questo è un account di posta personale di Riccardo Maria Grosso: tutte le opinioni espresse sono personali e non riflettono necessariamente quelle del mio datore di lavoroRiservatezza: In ottemperanza al D.Lgs. n. 196 del 30/6/2003 in materia di protezione dei dati personali, le informazioni contenute in questo messaggio sono strettamente riservate ed esclusivamente indirizzate al destinatario indicato (oppure alla persona responsabile di rimetterlo al destinatario). Vogliate tener presente che qualsiasi uso, riproduzione o divulgazione di questo messaggio è vietato. Nel caso in cui aveste ricevuto questo messaggio per errore, vogliate cortesemente avvertire il mittente e distruggere il presente messaggio.
Rispetto per l'ambiente - non stampare questa e.mail se davvero non ne hai bisognoConfidentiality: According to Italian law D.Lgs. 196/2003 concerning privacy, if you are not the addressee (or responsible for delivery of the message to such person) you are hereby notified that any disclosure, reproduction, distribution or other dissemination or use of this communication is strictly prohibited. If you have received this message in error, please destroy it and notify us by email.
Consider the environment - do not print this email if you really do not need to do so--Questo è un account di posta personale di Riccardo Maria Grosso: tutte le opinioni espresse sono personali e non riflettono necessariamente quelle del mio datore di lavoroRiservatezza: In ottemperanza al D.Lgs. n. 196 del 30/6/2003 in materia di protezione dei dati personali, le informazioni contenute in questo messaggio sono strettamente riservate ed esclusivamente indirizzate al destinatario indicato (oppure alla persona responsabile di rimetterlo al destinatario). Vogliate tener presente che qualsiasi uso, riproduzione o divulgazione di questo messaggio è vietato. Nel caso in cui aveste ricevuto questo messaggio per errore, vogliate cortesemente avvertire il mittente e distruggere il presente messaggio.
Rispetto per l'ambiente - non stampare questa e.mail se davvero non ne hai bisognoConfidentiality: According to Italian law D.Lgs. 196/2003 concerning privacy, if you are not the addressee (or responsible for delivery of the message to such person) you are hereby notified that any disclosure, reproduction, distribution or other dissemination or use of this communication is strictly prohibited. If you have received this message in error, please destroy it and notify us by email.
Consider the environment - do not print this email if you really do not need to do so--Questo è un account di posta personale di Riccardo Maria Grosso: tutte le opinioni espresse sono personali e non riflettono necessariamente quelle del mio datore di lavoroRiservatezza: In ottemperanza al D.Lgs. n. 196 del 30/6/2003 in materia di protezione dei dati personali, le informazioni contenute in questo messaggio sono strettamente riservate ed esclusivamente indirizzate al destinatario indicato (oppure alla persona responsabile di rimetterlo al destinatario). Vogliate tener presente che qualsiasi uso, riproduzione o divulgazione di questo messaggio è vietato. Nel caso in cui aveste ricevuto questo messaggio per errore, vogliate cortesemente avvertire il mittente e distruggere il presente messaggio.
Rispetto per l'ambiente - non stampare questa e.mail se davvero non ne hai bisognoConfidentiality: According to Italian law D.Lgs. 196/2003 concerning privacy, if you are not the addressee (or responsible for delivery of the message to such person) you are hereby notified that any disclosure, reproduction, distribution or other dissemination or use of this communication is strictly prohibited. If you have received this message in error, please destroy it and notify us by email.
Consider the environment - do not print this email if you really do not need to do so