Stelline, dato pubblico e dato open

16 views
Skip to first unread message

Matteo Brunati

unread,
Nov 9, 2010, 1:58:43 PM11/9/10
to spaghett...@googlegroups.com
Sera a tutti,
uno step in avanti nel capire cosa sia meglio per inserire per
risolvere un po' la questione dato pubblico, dato aperto e dato linked...

Come si diceva, ho inserito come test le stelline, aggiungendole come
colonna al foglio elettronico con la voce "linkability".
E per ovvie ragioni ho inserito una mini legenda che si richiamasse al
documento originale (
http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/ ):

> http://www.spaghettiopendata.org/dev.html

La questione ᅵ interessante, e ovviamente io poi inserirei un punto
sulle FAQ per chiarire un po' tale aspetto.
Per far capire ad un pubblico non tecnico il grado di riusabilitᅵ del
dato puᅵ essere una simbologia davvero utile .)
Tra l'altro se cliccate sulla voce "Linkabilitᅵ" ( licenza poetica, ma
cosa ci scriviamo in alternativa? idee? ) si ordinano i dataset in base
al livello di stelline inserite, in entrambi i sensi...

Intanto mi piacerebbe capire il primo punto piᅵ a fondo: nel post citato
il primo punto simboleggia che il dato sia online in pratica e basta.
Non si fa riferimento a niente altro. Un po' il concetto emerso anche in
questi giorni.

E qui si alzano gli altarini: PDF, TXT e/o HTML se vogliamo sono un
formato testo non strutturato in gergo, per cui se devo rielaborare i
dati devo farci un lavoro immane sopra ( e quindi non li rielaboro
tendenzialmente ).
Per questo motivo io lascerei i dati in PDF usando questa forma per far
capire il perchᅵ e creare domanda implicita...

La medesima cosa vale per i servizi Web che sputano fuori solo HTML,
come gli archivi delle elezioni.
Sfruttando questa metafora, rimarrebbero in lista in effetti.

Piccola nota per chi ha diritto di modifica sul foglio elettronico: non
inserire i punti e virgola e copiare dagli esempi o chiedetemi in caso...

Cosa ne dite del compromesso, lo mettiamo online ufficialmente? ( io
posso farla fino alle 22 tale modifica )

Matt

Luca Mearelli

unread,
Nov 9, 2010, 3:13:40 PM11/9/10
to spaghett...@googlegroups.com

ciao,

2010/11/9 Matteo Brunati <ma...@blog.dagoneye.it>

La questione è interessante, e ovviamente io poi inserirei un punto sulle FAQ per chiarire un po' tale aspetto.
Per far capire ad un pubblico non tecnico il grado di riusabilità del dato può essere una simbologia davvero utile .)

a me pare un'ottima idea
 
E qui si alzano gli altarini: PDF, TXT e/o HTML se vogliamo sono un formato testo non strutturato in gergo, per cui se devo rielaborare i dati devo farci un lavoro immane sopra ( e quindi non li rielaboro tendenzialmente ).
 
hmm mentre txt e html sono (in qualche modo) rielaborabili, i PDF di per se potrebbero anche non esserlo, ovvero non essere proprio 'testo'. I PDF possono anche essere composti semplicemente da 'sequenze di immagini', come capita se si produce un PDF da 'scansioni di documenti cartacei (e l'ho visto in piu occasioni proprio per documenti prodotti da amministrazioni pubbliche).

In quel caso hanno un grado di apertura decisamente inferiore ad un TXT o ad un HTML,o forse a seconda di come sono impostati anche i dati in txt o HTML hanno un grado di apertura piu' alto...

Insomma nell'assegnare le stelline non guarderei rigidamente al formato, ma anche quanto questo sia utilizzabile (un servizio web che sputa fuori solo html, se l'html e' sufficientemente "regolare" puo' essere molto piu utile di un PDF)


Luca

Pietro Blu Giandonato

unread,
Nov 9, 2010, 4:03:28 PM11/9/10
to spaghett...@googlegroups.com
2010/11/9 Matteo Brunati <ma...@blog.dagoneye.it>

Sera a tutti,
 uno step in avanti nel capire cosa sia meglio per inserire per risolvere un po' la questione dato pubblico, dato aperto e dato linked...

Sicuramente importante, una classificazione delle fonti di dati sulla quale SOD può giocare un ruolo di "prescreening" dei dati, facendo il "lavoro sporco" per CKAN, che invece è più "puro" e ha una funzione di catalogo dei metadati dettagliata e rigorosa.
 
Come si diceva, ho inserito come test le stelline, aggiungendole come colonna al foglio elettronico con la voce "linkability".
E per ovvie ragioni ho inserito una mini legenda che si richiamasse al documento originale (  http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/ ):

Magari potremmo anche aggiungere il "link factor" numerico di cui parlavano in webofdata, tenendolo per ora nascosto da Exhibit. Le classi sono sempre 5.
 
> http://www.spaghettiopendata.org/dev.html

La questione è interessante, e ovviamente io poi inserirei un punto sulle FAQ per chiarire un po' tale aspetto.
Per far capire ad un pubblico non tecnico il grado di riusabilità del dato può essere una simbologia davvero utile .)
Tra l'altro se cliccate sulla voce "Linkabilità" ( licenza poetica, ma cosa ci scriviamo in alternativa? idee? ) si ordinano i dataset in base al livello di stelline inserite, in entrambi i sensi...

Certamente nelle FAQ dovremmo essere più descrittivi che non con la sola legenda. Il ruolo didattico e informativo che SOD deve avere è un altro grande valore aggiunto, soprattutto per il cittadino comune che vuole diventare hacktivista.
 
Intanto mi piacerebbe capire il primo punto più a fondo: nel post citato il primo punto simboleggia  che il dato sia online in pratica e basta.

Non si fa riferimento a niente altro. Un po' il concetto emerso anche in questi giorni.

Assolutamente d'accordo.
 
E qui si alzano gli altarini: PDF, TXT e/o HTML se vogliamo sono un formato testo non strutturato in gergo, per cui se devo rielaborare i dati devo farci un lavoro immane sopra ( e quindi non li rielaboro tendenzialmente ).
Per questo motivo io lascerei i dati in PDF usando questa forma per far capire il perchè e creare domanda implicita...


La medesima cosa vale per i servizi Web che sputano fuori solo HTML, come gli archivi delle elezioni.
Sfruttando questa metafora, rimarrebbero in lista in effetti.

Se siamo tutti d'accordo che SOD deve essere il luogo nel quale concentrare segnalazioni di dati pubblici (sempre intesi come pubblicamente disponibili) al di là del formato nel quale sono distribuiti, allora sì, dobbiamo metterci tutto.

SOD avrebbe il ruolo di strumento di benchmarking passivo dei dati pubblici: se un Comune o un soggetto qualunque eroga dati in formato PDF (addirittura "scansionati" come faceva presente Luca Mearelli), ne verrebbe fuori perdente in un "confronto" con un'altro soggetto che invece virtuosamente mette a disposizione dati in formato CSV o addirittura direttamente linkabili. A me sembra un gran bel valore questo.
 
Piccola nota per chi ha diritto di modifica sul foglio elettronico: non inserire i punti e virgola e copiare dagli esempi o chiedetemi in caso...

Ricevuto.
 
Cosa ne dite del compromesso, lo mettiamo online ufficialmente? ( io posso farla fino alle 22 tale modifica )

Per me, si stampi!

Grazie per il lavoro fatto Matt,
pb

 

 Matt




Matteo Brunati

unread,
Nov 12, 2010, 3:22:30 PM11/12/10
to spaghett...@googlegroups.com
Il 09/11/10 22:03, Pietro Blu Giandonato ha scritto:
2010/11/9 Matteo Brunati <ma...@blog.dagoneye.it>
Sera a tutti,
 uno step in avanti nel capire cosa sia meglio per inserire per risolvere un po' la questione dato pubblico, dato aperto e dato linked...

Sicuramente importante, una classificazione delle fonti di dati sulla quale SOD può giocare un ruolo di "prescreening" dei dati, facendo il "lavoro sporco" per CKAN, che invece è più "puro" e ha una funzione di catalogo dei metadati dettagliata e rigorosa.
 
Come si diceva, ho inserito come test le stelline, aggiungendole come colonna al foglio elettronico con la voce "linkability".
E per ovvie ragioni ho inserito una mini legenda che si richiamasse al documento originale (  http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/ ):

Magari potremmo anche aggiungere il "link factor" numerico di cui parlavano in webofdata, tenendolo per ora nascosto da Exhibit. Le classi sono sempre 5.
 
> http://www.spaghettiopendata.org/dev.html


Giusto in tema, segnalo un post sulle stelline notevole che forse ci aiuta ( per i tecnici ) a capire cosa si potrebbe fare:

-> http://webofdata.wordpress.com/2010/11/12/linked-open-data-star-scheme-by-example/

Luigi Selmi chiede, tra le altre cose questo: se un ente ed un governo è arrivato alle tre stelle, ma non riesce a capire che vocabolari o ontologie usare ( quello che son curioso di sentire il 20 da paolo di pietro, che sarà estremamente interessante ), si può immaginare un livello intermedio tra tre o quattro stelline?

risposta: se si usano degli URI per identificare le risorse di cui si parla, allora sì, lo step si può considerare alle quattro stelline.
Perchè? Se ho risorse con URI, qualsiasi altro può aggiungere info utile su quella determinata risorsa, volendo.
Senza URI, non potrei farlo.

Dettagli tecnici, che forse qui sono più chiari:
> http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/

Il 4 e 5 livello sembrano solo html: in realtà sono pagine RDFa, e l'ultima integra dati da altre fonti della nuvola.
Per dire: l'apparenza inganna, ma il topic è assolutamente attuale!

"I like TimBL’s 5-star deployment scheme for Linked Open Data. However, every time I use it to explain the migration path from ‘no-data-on-the-Web’ to the ‘Full Monty’, no matter if to students, in training sessions or to industry partners, there comes a point where it would be very handy to refer to a concrete example that demonstrates the entire scheme."

Per i curiosi, avevo fatto un esperimento proprio con RDFa, iniziato quasi un anno orsono con le leggi su internet ( quadro dei decreti legge )
> http://www.metafora.it/leggi-internet/filirossi.html ( pagina con RDFa con schema associato, ma che poi non ho più inserito in realtà, era assolutamente incompleto e forse con qualche errore, ma utile a livello didattico, usato anche in alcune lezioni su facebook opengraph in effetti )

Credo che il filone delle stelline ci possa davvero dare una mano.
Altri feedback in merito?

ps - ho qc dilemma sotto Internet Explorer nella visualizzazione delle stelle, perchè non sono un'immagine ma un carattere speciale. E' perchè mancando del ; nella colonna del foglio elettronico non le interpreta correttamente...

 Matt

stefano bertolo (@sclopit)

unread,
Nov 13, 2010, 7:48:11 AM11/13/10
to Spaghetti Open Data
un modo di dotare un data set di URI senza essere costretti a fare una
scelta preliminare su un vocabolario o una ontologia e' quello di
utilizzare URI per specifiche entita', lasciando ad un secondo tempo
(e a diversi utenti o applicazioni) la scelta della applicazione.

come strumento utile per la gestione di identificatori URI per entita'
vi segnalo

http://www.okkam.org

che e' stato sviluppato dalla universita' di Trento nel contesto di un
consorzio europeo.

per esempio, l'identificatore OKKAM che mi identifica e'

http://www.okkam.org/entity/ed5bdc09-ca66-4435-b48e-6df558315fa1

una qualsiasi raccolta di dati che intenda riferirsi a me
specificamente e non ad altri "Stefano Bertolo" che esistono al mondo
puo' utilizzare questo identificatore.

Il server di OKKAM contiene gia' identificatori per 7.5 milioni di
entita', ha una API che ti consente di ricevere identificatori a
partire da una breve descrizione testuale della entita' desiderata e
di crearne di nuovi se ve ne servono, etc...

Le entita' OKKAM sono gia' utilizzate dalla universita' di Trento e da
vari progetti interni della Provincia di Trento.

mi permetto di sostenere senza timore di essere smentito che questo e'
un pezzo importantissimo di una infrastruttura integrata per la
condivisione di dati e che in questo in Italia siamo alla assoluta
avanguardia.

vi consiglio di visitare il sito di OKKAM e di mettervi in contatto
con il coordinatore Paolo Bouquet per imparare a sfruttare al meglio
questa risorsa.

ciao

stefano

On Nov 12, 9:22 pm, Matteo Brunati <m...@blog.dagoneye.it> wrote:
> Il 09/11/10 22:03, Pietro Blu Giandonato ha scritto:
>
>
>
> > 2010/11/9 Matteo Brunati <m...@blog.dagoneye.it
> > <mailto:m...@blog.dagoneye.it>>
>
> >     Sera a tutti,
> >      uno step in avanti nel capire cosa sia meglio per inserire per
> >     risolvere un po' la questione dato pubblico, dato aperto e dato
> >     linked...
>
> > Sicuramente importante, una classificazione delle fonti di dati sulla
> > quale SOD pu� giocare un ruolo di "prescreening" dei dati, facendo il
> > "lavoro sporco" per CKAN, che invece � pi� "puro" e ha una funzione di
> > catalogo dei metadati dettagliata e rigorosa.
>
> >     Come si diceva, ho inserito come test le stelline, aggiungendole
> >     come colonna al foglio elettronico con la voce "linkability".
> >     E per ovvie ragioni ho inserito una mini legenda che si
> >     richiamasse al documento originale (
> >    http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
> >     ):
>
> > Magari potremmo anche aggiungere il "link factor" numerico di cui
> > parlavano in webofdata
> > <http://webofdata.wordpress.com/2010/03/01/data-and-the-web-choices/>,
> > tenendolo per ora nascosto da Exhibit. Le classi sono sempre 5.
>
> >     >http://www.spaghettiopendata.org/dev.html
>
> Giusto in tema, segnalo un post sulle stelline notevole che forse ci
> aiuta ( per i tecnici ) a capire cosa si potrebbe fare:
>
> ->http://webofdata.wordpress.com/2010/11/12/linked-open-data-star-schem...
>
> Luigi Selmi chiede, tra le altre cose questo: se un ente ed un governo �
> arrivato alle tre stelle, ma non riesce a capire che vocabolari o
> ontologie usare ( quello che son curioso di sentire il 20 da paolo di
> pietro, che sar� estremamente interessante ), si pu� immaginare un
> livello intermedio tra tre o quattro stelline?
>
> risposta: se si usano degli URI per identificare le risorse di cui si
> parla, allora s�, lo step si pu� considerare alle quattro stelline.
> Perch�? Se ho risorse con URI, qualsiasi altro pu� aggiungere info utile
> su quella determinata risorsa, volendo.
> Senza URI, non potrei farlo.
>
> Dettagli tecnici, che forse qui sono pi� chiari:
>  >http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
>
> Il 4 e 5 livello sembrano solo html: in realt� sono pagine RDFa, e
> l'ultima integra dati da altre fonti della nuvola.
> Per dire: l'apparenza inganna, ma il topic � assolutamente attuale!
>
> "I like TimBL's 5-star deployment scheme for Linked Open Data. However,
> every time I use it to explain the migration path from
> 'no-data-on-the-Web' to the 'Full Monty', no matter if to students, in
> training sessions or to industry partners, there comes a point where it
> would be very handy to refer to a concrete example that demonstrates the
> entire scheme."
>
> Per i curiosi, avevo fatto un esperimento proprio con RDFa, iniziato
> quasi un anno orsono con le leggi su internet ( quadro dei decreti legge )
>  >http://www.metafora.it/leggi-internet/filirossi.html( pagina con
> RDFa con schema associato, ma che poi non ho pi� inserito in realt�, era
> assolutamente incompleto e forse con qualche errore, ma utile a livello
> didattico, usato anche in alcune lezioni su facebook opengraph in effetti )
>
> Credo che il filone delle stelline ci possa davvero dare una mano.
> Altri feedback in merito?
>
> ps - ho qc dilemma sotto Internet Explorer nella visualizzazione delle
> stelle, perch� non sono un'immagine ma un carattere speciale. E' perch�

Matteo Brunati

unread,
Nov 18, 2010, 10:37:25 AM11/18/10
to spaghett...@googlegroups.com

> un modo di dotare un data set di URI senza essere costretti a fare una
> scelta preliminare su un vocabolario o una ontologia e' quello di
> utilizzare URI per specifiche entita', lasciando ad un secondo tempo
> (e a diversi utenti o applicazioni) la scelta della applicazione.

ottima segnalazione OKKAM .)
aggiungo sul tema via Titti l'aggiornamento della pagina sulle stelline:

> http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/

Notevole la stellina uno come abbia incluso la licenza al dato pubblico.
Zero stelline il livello prima allora...

Da leggere.

Matt

Matteo Brunati

unread,
Nov 29, 2010, 6:29:45 AM11/29/10
to spaghett...@googlegroups.com
Il 18/11/10 16:37, Matteo Brunati ha scritto:

http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/
Notevole la stellina uno come abbia incluso la licenza al dato pubblico.
Zero stelline il livello prima allora...

Da leggere.

 Matt
ciao,
 al volo ho integrato lo schema delle stelline alla visualizzazione dati base per far emergere l'importanza del grado di riusabilità in vista dell'incontro di domani a roma,  un lato quindi assai pragmatico da far emergere[0].

-> http://www.spaghettiopendata.org/dati

Al momento ho messo zero stelline per il grado di interfaccia web, ovvero dove non si scaricano i dati ma si navigano e basta. Dove ci sono interfacce in flash ad esempio.
Il grado uno necessiterebbe anche il discorso licensing, dopo l'aggiornamento di un paio di settimane fa, per ora lo voglio far emergere come incongruenza domani poi lo facciamo in linea... Poi a livello tecnico passo a ragionare sull'integrazione ckan e annessi, niente paura...

Una nota sul licensing: quando mi hanno segnalato la regione sardegna ho chiesto come mai non hanno usato le licenze data commonns[1], credo meriti citare la risposta.

Relativamente alle open data commons le avevamo considerate ma:
- PDDL non impone nessuna restrizione sull'uso, mentre volevamo imporre almeno il divieto di rivendere i dati prodotti da noi, al fine di evitare lucro su dati già pagati dalla comunità;
- ODC-by e ODC-ODbL sono applicate solo al database in quanto struttura ma non ai contenuti; noi intendevamo con le nostre condizioni normare anche i contenuti. Abbiamo pertanto preso in considerazione l'idea di associre l'ODBL a una CC ma in effetti la CC non chiarisce benissimo il concetto di uso commerciale, che nel nostro caso consente di fare un uso dei dati ai fini di attività produttive, e di ricavare un guadagno dalle attività e dalle elaborazioni fatte a partire dai dati, ma non consente di vendere i dati originali nè quelli derivati.

Insomma abbiamo preferito una lista di condizioni d'uso più breve ed esplicita, che definisse con chiarezza quelli che secondo noi erano i punti più importanti e che non abbiamo trovato normati a sufficienza nelle licenze esistenti.

Credo siano spunti interessanti di riflessione.

[0] - http://www.hackthegov.it/
[1] - http://www.opendatacommons.org/licenses/


Reply all
Reply to author
Forward
0 new messages