Di che parla SOD: Open data o Public data? [Era: Friendly fire dagli amici stranieri, ma anche una critica (giusta)]

Pietro Blu Giandonato

unread,

Nov 8, 2010, 7:50:48 AM11/8/10

to spaghett...@googlegroups.com

Ci metto i miei due centesimi.

Capisco il "biasimo" di Titti Cimmino nel giudicare SOD come un "duplicato" inutile e controproducente di CKAN Ita.

Così come sottolineare che i dati pubblici non sempre siano aperti, e dunque quelli messi in SOD (in PDF o non in formati aperti) non si possano certamente definire "open".

Ma è proprio questa contraddizione che dovremmo tenere bene in evidenza, sia per evitare di essere giudicati come pleonastici, sia per portare all'attenzione del pubblico la grande differenza (ma anche grande dipendenza) che c'è tra i dati "pubblici" e quelli "aperti": non sempre gli uni implicano gli altri.

Voglio qui richiamare i concetti (che molti di voi già conosceranno) che ci sono dietro due importanti Direttive europee che riguardano i dati digitali: la INSPIRE e la PSI.

INSPIRE è una infrastruttura per l'informazione territoriale che riguarda tutti i dati digitali detenuti da autorità pubbliche, di rilevanza ambientale. Prevede che i suddetti dati vengano resi disponibili da queste in formati aperti, facilmente ricercabili, scaricabili e soprattutto con una struttura standard.

La Direttiva PSI punta parallelamente al riutilizzo dell'informazione nel settore pubblico. Cito testualmente (art. 5): "Gli enti pubblici mettono a disposizione i propri documenti in qualsiasi formato e lingua preesistente, ove possibile e opportuno per via elettronica". Non c'è dunque obbligo di renderli aperti, e addirittura liberi (ovvero privi di qualunque forma di copyright). E' qui però che noi facciamo leva: convincere l'autorità pubblica a rilasciare i dati in formati aperti e liberi, costruendo la massa critica dal basso, dai cittadini.

CKAN, così com'è a prima vista e a un utilizzatore medio può sembrare un pò ostico e freddo: non si sa da dove cominciare. Certo, una volta provato a giocarci, le cose diventano via via più chiare e se ne comprende la sua utilità. Ma bisogna riconoscere che un cittadino medio spesso non ha bisogno di sapere dove si trovano dati rigorosamente aperti, ma semplicemente "pubblici", ovvero raggiungibili e consultabili.

A questo punto, potremmo considerare SOD innanzitutto come un catalogo di dati pubblici, prima che aperti e liberi. Certo, comprendo le perplessità di Titti sul fatto che ci chiamiamo Spaghetti "Open Data" e che dunque quell'open risulti una forzatura. Ma diceva benissimo Matteo richiamando il concetto alla base dello spaghetti code: alla fine si tratta di entropia. In lista arrivano segnalazioni di fonti e di dati e tool i più disparati, spesso non aperti e nemmeno liberi. Ma prenderne nota vuol dire ritornarci dopo del tempo, per andare magari a bussare a chi li detiene e fargli presente che sarebbe utile, importante e per certi versi vantaggioso per se stessi renderli aperti e liberi. A volte basta suggerire di pubblicare una tabella non come PDF ma come file Excel (non voglio dire proprio CSV, anche se gli si può insegnare a farlo): basta poco, che ce vò... ;)

Per concludere, prenderei in seria considerazione l'idea di NON escludere dati che non siano in formati aperti, ma di svoltare SOD a vero e proprio catalogo di dati pubblici, e mi spingerei a dire che con tale termine non intendo nemmeno "provenienti da pubbliche amministrazioni" ma "pubblicamente disponibili sulla rete". In definitiva, SOD sarebbe un catalogo di dati pubblicamente disponibili, e classificati secondo la loro "linkability" come diceva Matteo col suo riferimento a WoD e/o con le mitiche "stelline" di Berners-Lee.

Insomma: dati aperti (CKAN) sottoinsieme di dati pubblici (SOD) = public (linkable) and (open) data. Le parentesi indicano che tali caratteristiche possono e devono essere misurate.

Che ne pensate?

pb

---

Pietro Blu Giandonato
AlterGeo http://www.altergeo.eu
My web 2.0 life http://bit.ly/giandonato

Linkedin http://it.linkedin.com/in/pietroblu

2010/11/8 Irene Celino <irene....@gmail.com>

Anche io sono d'accordo con la stellina.

Anzi, se vogliamo andare nella direzione dei linked open data (e non semplicemente degli open data), potremmo riutilizzare le stelline di tim Berners-Lee:
http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
Ovvero, una scala da 1 a 5 stelle per indicare *quanto* aperto (e linkato) è uno specifico dataset.

HTH,
Irene

Il giorno 08 novembre 2010 12:40, Alberto Cottica <alb...@cottica.net> ha scritto:

Buona l'idea della stellina! È il tipo di rinforzo positivo che mi piace usare nelle mie cose.

--

" If you understand what you're doing,
you're not learning anything. "

Piero Luisi

unread,

Nov 8, 2010, 9:09:17 AM11/8/10

to Spaghetti Open Data

Due contributi:

1 - dati pubblici: forse sarebbe opportuno qualificare meglio questi
dati. Cosa vuol dire, infatti, pubblici: che provengono/sono
aggiornati da pubbliche amministrazioni o che riguardano servizi
pubblici/di interesse generale? Io direi la seconda accezione.

2 - "linkability": open data o open meta data? Ne parlerà Paolo di
Pietro il 20 a Senigaglia, ma avendo lavorato con lui proprio alla
modellazione XSD dei web services dei servizi della pubblica
amministrazione locale, credo davvero che non sia sufficiente
"liberare" i dati perchè questi siano utili all'utente; se, cioè, non
si stabilisce una grammatica d'uso standard che li renda disponibili
dai santuari delle applicazioni/gestionali verticali (anche se SOA).

On 8 Nov, 13:50, Pietro Blu Giandonato <p.giandon...@gmail.com> wrote:
> Ci metto i miei due centesimi.
>
> Capisco il "biasimo" di Titti Cimmino nel giudicare SOD come un "duplicato"
> inutile e controproducente di CKAN Ita.
> Così come sottolineare che i dati pubblici non sempre siano aperti, e dunque
> quelli messi in SOD (in PDF o non in formati aperti) non si possano
> certamente definire "open".
>
> Ma è proprio questa contraddizione che dovremmo tenere bene in evidenza, sia
> per evitare di essere giudicati come pleonastici, sia per portare
> all'attenzione del pubblico la grande differenza (ma anche grande
> dipendenza) che c'è tra i dati "pubblici" e quelli "aperti": non sempre gli
> uni implicano gli altri.
>
> Voglio qui richiamare i concetti (che molti di voi già conosceranno) che ci
> sono dietro due importanti Direttive europee che riguardano i dati digitali:

> la INSPIRE <http://it.wikipedia.org/wiki/INSPIRE> e la
> PSI<http://www.epsiplus.net>
> .

> <http://bit.ly/giandonato>Linkedinhttp://it.linkedin.com/in/pietroblu
>
> 2010/11/8 Irene Celino <irene.cel...@gmail.com>

>
> > Anche io sono d'accordo con la stellina.
>
> > Anzi, se vogliamo andare nella direzione dei linked open data (e non
> > semplicemente degli open data), potremmo riutilizzare le stelline di tim
> > Berners-Lee:
> >http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
> > Ovvero, una scala da 1 a 5 stelle per indicare *quanto* aperto (e linkato)
> > è uno specifico dataset.
>
> > HTH,
> > Irene
>

> > Il giorno 08 novembre 2010 12:40, Alberto Cottica <albe...@cottica.net> ha

Matteo Brunati

unread,

Nov 8, 2010, 10:02:25 AM11/8/10

to spaghett...@googlegroups.com

> Due contributi:
>
> 1 - dati pubblici: forse sarebbe opportuno qualificare meglio questi
> dati. Cosa vuol dire, infatti, pubblici: che provengono/sono
> aggiornati da pubbliche amministrazioni o che riguardano servizi
> pubblici/di interesse generale? Io direi la seconda accezione.
>

Un tema mi pare gi� emerso: direi entrambi in realt� di fatto. Utili per
fini diversi, ma complementari nelle loro sinergie. Qui forse ha maggior
peso la seconda, ma sono alla pari direi.
Ed infatti molte delle segnalazioni riguardano dati del secondo tipo, ma
anche sul primo ( soprattutto a livello di operato e investimento ).

> 2 - "linkability": open data o open meta data? Ne parler� Paolo di

> Pietro il 20 a Senigaglia, ma avendo lavorato con lui proprio alla
> modellazione XSD dei web services dei servizi della pubblica
> amministrazione locale, credo davvero che non sia sufficiente

> "liberare" i dati perch� questi siano utili all'utente; se, cio�, non

> si stabilisce una grammatica d'uso standard che li renda disponibili
> dai santuari delle applicazioni/gestionali verticali (anche se SOA).
>

Ottimo, sar� una discussione interessante quella che emerger� a Senigallia
per i tecnici. E qui per non scendere troppo nel dettaglio direi che sia
il caso di citare un concetto: quello di Linked Data.

"Linked Data is a sub-topic of the Semantic Web. The term Linked Data is
used to describe a method of exposing, sharing, and connecting data via
dereferenceable URIs on the Web." via Wikipedia.

Quello che qui interviene � il ruolo delle ontologie e del modello comune
indipendente dei dati che tratto, che � RDF, e qui se vogliamo
approfondire sia Irene che Titti sono assai pi� ferrate di me
sull'argomento .)

Quello che volevo aggiungere io � il concetto di dato raggiungibile via
Web attraverso un percorso HTTP che conosciamo bene, sia se parlo del
dataset che del singolo dato del dataset in realt�... Questo � uno degli
elementi forse davvero dirompenti per quanto riguarda la differenza tra le
chiamate tra web services classiche ( e quindi il dilemma dei formati dei
dati ) ed il processo semantico e linked data...

Se uso percorsi URL tipo per dire di cosa parlano i dati, posso poi dire
che certe cose sono dei sinonimi in realt� semplicemente aggiungendo meta
informazione man mano che mi serve...

Questo � breve ma lampante nell'impostazione direi in merito:

> http://www.w3.org/TR/gov-data/

Sar� interessante unire tale dinamica con quello che � stato fatto dal
progetto italiano Linked Open Camera e vedere il confronto che nasce per
capire i retroscena e farli capire anche ai non tecnici...
Elemento fondamentale questo.

Qui una veloce discussione sul tema che trovo on topic:

> http://www.innovatoripa.it/posts/2010/11/1508/open-data-vs-valid-data-and-open-data-what

Matt

Alberto

unread,

Nov 8, 2010, 10:58:54 AM11/8/10

to Spaghetti Open Data

Io non sono abbastanza geek per capire tutti i risvolti tecnici delle
diverse soluzioni dal lato di chi rilascia il dato. Leggendo la
discussione su Innovatori PA linkata da Matteo, però, mi viene da fare
un'ipotesi. Non è che dietro alle nostre diverse posizioni ci sono
idee diverse di utilizzo?

Mi spiego. A me interessa soprattutto alimentare una discussione ampia
e basata sui dati sulle scelte di policy. Per cui, se tu mi dai delle
serie di dati di spesa e di performance in un formato scaricabile ed
elaborabile, io sono già contento. Un Excel o un CSV con le colonne
che abbiano dei titoli comprensibili va benissimo.

Se invece, metti caso, io fossi un'azienda, e mi faccio il viaggio di
integrare dati pubblici per costruire un servizio vendibile, allora
cambia tutto. La base dati deve essere aggiornata, dice giustamente
quel Gianfranco nella discussione linkata da Matt; deve essere più
semantica possibile, perché io, azienda, voglio scrivere il codice,
accendere il server e stare a guardare i soldi che entrano. Il mio uso
non è orientato a produrre conoscenza one shot, ma a produrre servizi
in continuo.

Dico scemenze?

Piero Luisi

unread,

Nov 8, 2010, 11:09:46 AM11/8/10

to Spaghetti Open Data

On 8 Nov, 16:58, Alberto <alberto.cott...@gmail.com> wrote:
> Io non sono abbastanza geek per capire tutti i risvolti tecnici delle
> diverse soluzioni dal lato di chi rilascia il dato. Leggendo la
> discussione su Innovatori PA linkata da Matteo, però, mi viene da fare
> un'ipotesi. Non è che dietro alle nostre diverse posizioni ci sono
> idee diverse di utilizzo?

Premessa: non sono un tecnico, ma colgo proprio questa differenti idee
di utilizzo. O meglio, credo che ci siano.

Provo a sintetizzare: gli open data servono:
- per l'open government (utili alle scelte di policy);
- per l'e-government (utili per l'apertura del mercato delle soluzioni
di servizi pubblici online, cioè per i cittadini che ne beneficiano)

Dico scemenze? ;)

Irene Celino

unread,

Nov 8, 2010, 11:17:11 AM11/8/10

to spaghett...@googlegroups.com

Alberto, se posso aggiungere i miei due cent, no, non dici affatto scemenze, ma credo che ci siano un certo numero di dimensioni "semantiche" della faccenda che non possono essere affrontate tutte insieme.

0) la tipologia di dati (finanziamenti vs. dati geografici vs. elenchi di soggetti giuridici, ecc.)
1) il formato dei dati e il loro livello di linkabilità (le 5 stelle di cui dicevo in un'altra mail)
2) l'origine dei dati (governativa vs. pubblica come faceva notare Pietro all'inizio del thread)
3) la qualità dei dati (prodotti manualmente vs. estratti in automatico da qualche sorgente diversa, ecc.)
4) l'aggiornamento o in generale la validità temporale dei dati (dati del 2010 vs. dati del 1999, ecc.)
5) ecc.

Secondo me iniziare (come credo che stiamo facendo) dal tipo e dal formato dei dati è già un bel passo. Man mano che cresciamo, possiamo aggiungere tutte le dimensioni di caratterizzazione dei dati che ci sembrano rilevanti.

Irene

titti cimmino

unread,

Nov 8, 2010, 11:25:05 AM11/8/10

to spaghett...@googlegroups.com

Il giorno 08/nov/2010, alle ore 17.17, Irene Celino ha scritto:

> Alberto, se posso aggiungere i miei due cent, no, non dici affatto scemenze, ma credo che ci siano un certo numero di dimensioni "semantiche" della faccenda che non possono essere affrontate tutte insieme.
>
> 0) la tipologia di dati (finanziamenti vs. dati geografici vs. elenchi di soggetti giuridici, ecc.)
> 1) il formato dei dati e il loro livello di linkabilità (le 5 stelle di cui dicevo in un'altra mail)
> 2) l'origine dei dati (governativa vs. pubblica come faceva notare Pietro all'inizio del thread)
> 3) la qualità dei dati (prodotti manualmente vs. estratti in automatico da qualche sorgente diversa, ecc.)
> 4) l'aggiornamento o in generale la validità temporale dei dati (dati del 2010 vs. dati del 1999, ecc.)
> 5) ecc.

5) la granularità con cui sono presentati
6) la licenza con cui sono rilasciati

continuo a vedere una gran confusione.. attenzione perché si va alla deriva e si perde il meglio che c'è in questa lista

_________________________
Titti Cimmino

http://titticimmino.com
http://twitter.com/titticimmino
http://identi.ca/titticimmino/

iChat tittic...@mac.com
skype id: zen...zero

t...@titticimmino.com
tici...@gmail.com

mobile 1 +39 3339470791
mobile 2 +39 3469483969
tel 0818931230
fax 0818931230

Matteo Brunati

unread,

Nov 8, 2010, 12:06:14 PM11/8/10

to spaghett...@googlegroups.com

>
> Il giorno 08/nov/2010, alle ore 17.17, Irene Celino ha scritto:
>
>> Alberto, se posso aggiungere i miei due cent, no, non dici affatto
>> scemenze, ma credo che ci siano un certo numero di dimensioni
>> "semantiche" della faccenda che non possono essere affrontate tutte
>> insieme.
>>
>> 0) la tipologia di dati (finanziamenti vs. dati geografici vs. elenchi
>> di soggetti giuridici, ecc.)

>> 1) il formato dei dati e il loro livello di linkabilit� (le 5 stelle di

>> cui dicevo in un'altra mail)
>> 2) l'origine dei dati (governativa vs. pubblica come faceva notare
>> Pietro all'inizio del thread)

>> 3) la qualit� dei dati (prodotti manualmente vs. estratti in automatico

>> da qualche sorgente diversa, ecc.)

>> 4) l'aggiornamento o in generale la validit� temporale dei dati (dati

>> del 2010 vs. dati del 1999, ecc.)
>> 5) ecc.

> 5) la granularit� con cui sono presentati

> 6) la licenza con cui sono rilasciati
>

> continuo a vedere una gran confusione.. attenzione perch� si va alla
> deriva e si perde il meglio che c'� in questa lista
>>

Benritrovata Titti, � vero: facciamo un po' di ordine.

Lo step della raccolta di SOD ha una valenza meno rigorosa di quella del
CKAN ma ha avuto una curva di apprendimento minore iniziale.
Uno step necessario per avvicinare personale non tecnico a certe
dimensioni forse. Almeno questa � una mia sensazione, col senno di poi.
Meno rigore significa pi� confusione: ma la confusione almeno crea la
motivazione per fermarsi su certi punti.

Come diceva Paolo oggi in una bella sintesi, forse la maggiore utilit� di
SOD rientra proprio nel far emergere i dati pubblici e governativi che poi
possano rientrare a pieno titolo nel CKAN e nel rendere espliciti tali
passaggi, anche graficamente.

Dal punto di vista tecnico io e spero qualcun altro ( non prima del 20, ma
sicuramente dopo ) mi rendo disponibile a dare una mano per integrare
Exhibit con il CKAN italiano in modo da sfruttarlo come backend in maniera
definitiva, per quello che riesco e come gi� avevo accennato, e
parallelamente mi piacerebbe l'idea di tenere in piedi SOD anche per
segnalare servizi e applicazioni Web che dovrebbero diventare raw data, e
quindi inseribili nel CKAN in un secondo tempo.
Sbaglio o tale dimensione si voleva fosse inserita anche nel CKAN in un
suo sviluppo successivo?
Nel qual caso, la sfruttiamo dall'inizio ovviamente.

Cosa ne dite?

Soprattutto sul valore di:
- tenere SOD per raccogliere anche dati pubblici con 0 stelline ( dati
frutto di interfacce web non esportabili ) per creare domanda di riuso e
di open data e mostrare le differenze rispetto a chi si muove meglio
- sfruttare questa nostra aggregazione di esperienze per mostrare meglio
quello che comporta un'innovazione tecnologica difficile da spiegare come
quella del Web of Data che valorizza gli Open Data usando il caso SOD
come racconto di miglioramento agile
- continuare a chiarire le idee in merito, che il tema � ampio. Nicola
Mattina aveva aperto un google site proprio per aggregare gli spunti che
emergono in lista ed organizzarli per non perderli e chiarirli sempre pi�
in effetti.

Matt

Lorenzo Benussi

unread,

Nov 8, 2010, 12:28:48 PM11/8/10

to spaghett...@googlegroups.com

Provo anche io a dare il mio contributo.

Credo che le caratteristiche da considerare siano tre:
1) tecnologia - i dati sono machine-readable?
2) licenza - posso utilizzarli per qualunque scopo?
3) prezzo - sono gratuiti?
Ognuna delle tre è importante e non credo si possa parlare di open data se i dati non hanno tutte e tre queste peculiarità.

Non credo che un pdf sia open data come non credo che una licenza non commerciale sia open data.
Sono però convinto che sia necessario ragionare anche per gradi e approssimazioni con interlocutori spesso difficili e dunque ben venga ogni tentativo di proporre il "modello" in senso ampio. Non posso che non supportare tutte le iniziative in questo senso, però, è necessario fare dei distinguo. Tra l'atro penso che l'open knowledge definition (in italiano qui http://www.opendefinition.org/okd/italiano/) sia un ottimo riferimento.

Nella mia esperienza di dati.piemonte le cose sono andate bene - per ora - perché stiamo cercando di fare qualcosa che "funzioni" seguendo il modello open data. Perché se tolgo, ad esempio, l'utilizzo commerciale viene a mancare il razionale economico (nel senso di applicazioni e servizi) e tutto si indebolisce. Oppure se dico che un pdf è open data, allora quando finalmente open data sarà legge avremo qualcuno che si sentirà in dovere di fornire pdf e nulla più.
Se vogliamo che open data funzioni o lo adottiamo al 100% oppure rischiamo di far nascere ibridi che hanno la tendenza a non funzionare.

Forse sarebbe necessario, ci penso da un po', pensare un Open Data Manifesto (seguendo i riferimenti OFK).
ciao, l.

Alberto Cottica

unread,

Nov 8, 2010, 2:07:53 PM11/8/10

to spaghett...@googlegroups.com

D'accordo su tutto tranne che sull'utilizzo commerciale – che peraltro, nella pratica, finora non è che abbia prodotto tutti questi grandi business, quindi è più un punto teorico. Condivido con Hakon Lie l'idea che i dati della pubblica amministrazione li abbiamo già pagati, quindi non dobbiamo ripagarli di nuovo.

Stefano Costa

unread,

Nov 8, 2010, 3:57:53 PM11/8/10

to spaghett...@googlegroups.com

Il giorno lun, 08/11/2010 alle 18.06 +0100, Matteo Brunati ha scritto:
>
> Come diceva Paolo oggi in una bella sintesi, forse la maggiore utilità

> di SOD rientra proprio nel far emergere i dati pubblici e governativi
> che poi possano rientrare a pieno titolo nel CKAN e nel rendere
> espliciti tali passaggi, anche graficamente.

Matteo,
concordo sull'importanza strategica di una visualizzazione amichevole e
credo che questo sia il grande merito di SOD, ma permettimi di esprimere
un diverso parere su due punti:
* CKAN Italia non è previsto per contenere informazioni ristrette
ai soli Linked Open Data - altrimenti ci sarebbe solo 1 dataset,
ovvero Linked Open Camera. Come abbiamo scritto nella
presentazione io e Federico Morando
http://blog.okfn.org/2010/06/14/launch-of-itckannet-for-open-data-in-italy/ l'obiettivo è quello di migliorare la comprensione dello stato dei dati pubblici in Italia. È sotto gli occhi di tutti noi che questa situazione non sia affatto buona, ma che al tempo stesso ci siano significativi margini di miglioramento negli ultimi tempi. Inoltre non chiudiamo la porta a dati di interesse pubblico che vengono da fonti esterne alla PA (es. per i dati geografici OpenStreetMap)
* non trovo che l'inserimento delle informazioni in CKAN sia molto
più complesso rispetto ad uno spreadsheet - in parte perché
trovo che il form sia più leggibile e in parte perché giocoforza
le informazioni che devono essere immesse sono molto simili.
Concordo tuttavia sull'importanza di un miglioramento a livello
di usabilità. Questa settimana io e Friedrich Lindenberg ci
occuperemo dell'upgrade alla versione più recente, mi rendo
disponibile dalla settimana prossima per una chat con Stefano
Durì che si era detto interessato all'inserimento dei dati e con
chiunque altro voglia iniziare a lavorare su CKAN

Trovo che tra critiche, opinioni diverse e passi avanti pratici stia
emergendo una via italiana agli open data che forse alcuni troveranno
persino inaspettata. Io credo che sia solo l'inizio.

Infine, chiedo scusa se a volte affronto alcuni temi in modo deciso e su
posizioni ferme (es. CKAN), questo è per me una conseguenza della
fiducia che ripongo nel progetto a lungo termine e nella visione di Open
Knowledge Foundation, di cui CKAN è solo uno dei molti strumenti di
azione.

Un saluto,
steko

--
Stefano Costa
Coordinator, Working Group on Open Data in Archaeology
http://wiki.okfn.org/wg/archaeology
The Open Knowledge Foundation
http://www.okfn.org · http://opendefinition.org/

Pietro Blu Giandonato

unread,

Nov 8, 2010, 4:44:37 PM11/8/10

to spaghett...@googlegroups.com

Stiamo dicendo sostanzialmente la stessa cosa: sarebbe opportuno che
nessuno tema l'altro.

Sono convinto che il buonsenso di tutti conduca a una sana
collaborazione e convergenza delle azioni.

CKAN è la "via" agli open data, e come dicevo all'inizio del thread
andrebbe solo reso meno ostico ai più. La notizia di Steko riguardo un
suo miglioramento dell'interfaccia è ottima.

SOD è tra le altre cose un progetto sociale, nel quale la gente possa
trovare oltre che un repository di dati pubblici (ribadisco: non
perché provenienti dalla PA ma perché pubblicamente disponibili in
rete, e talvolta anche aperti), anche tools per il loro utilizzo, e un
luogo di discussione, di confronto.

Buona serata,
Pietro

--

Matteo Brunati

unread,

Nov 9, 2010, 4:10:08 AM11/9/10

to spaghett...@googlegroups.com

> Matteo,
> concordo sull'importanza strategica di una visualizzazione amichevole e
> credo che questo sia il grande merito di SOD, ma permettimi di esprimere
> un diverso parere su due punti:
> * CKAN Italia non è previsto per contenere informazioni ristrette
> ai soli Linked Open Data - altrimenti ci sarebbe solo 1 dataset,
> ovvero Linked Open Camera.

Ciao Stefano, grazie della delucidazione che fa sempre bene.
Tra l'altro mi sembra che SOD sia la realt� che di fatto auspicavate in un
certo senso:

"The key point is that national and regional governments own large
datasets that would be quite easily made available to the public. This
process would however require 3 distinct actors, as outlined in the Open
Data study by Becky Hogge:

* government heads
* civil servants (acting as the �middle layer�)
* a small but determined group of citizens (or �civic hackers�)
"

In effetti ci manca il primo punto, ma sul resto stiamo migliorando.

> Concordo tuttavia sull'importanza di un miglioramento a livello
> di usabilità. Questa settimana io e Friedrich Lindenberg ci
> occuperemo dell'upgrade alla versione più recente, mi rendo
> disponibile dalla settimana prossima per una chat con Stefano
> Durì che si era detto interessato all'inserimento dei dati e con
> chiunque altro voglia iniziare a lavorare su CKAN
>

Ottimo: io mi rendo disponibile per potenziali mashup usando Exhibit e
similari, ma questo dopo il 20 in ogni caso. Ed intanto mi studio un po'
l'organizzazione semantica che avete adottato, ed ai vocabolari in uso dal
ckan, grazie anche alle segnalazioni di Titti in merito che mi ha fatto.

> Trovo che tra critiche, opinioni diverse e passi avanti pratici stia
> emergendo una via italiana agli open data che forse alcuni troveranno
> persino inaspettata. Io credo che sia solo l'inizio.

Gi� e questo � un passo positivo, assolutamente.

>
> Infine, chiedo scusa se a volte affronto alcuni temi in modo deciso e su
> posizioni ferme (es. CKAN), questo è per me una conseguenza della
> fiducia che ripongo nel progetto a lungo termine e nella visione di Open
> Knowledge Foundation, di cui CKAN è solo uno dei molti strumenti di
> azione.
>

E fai bene: OKF � il nostro faro in effetti su molteplici temi.

Matt

Lorenzo Benussi

unread,

Nov 9, 2010, 5:40:46 AM11/9/10

to spaghett...@googlegroups.com

Commerciale vs non commerciale. Io credo che la possibilità di utilizzo commerciale sia essenziale e proverei brevemente ad argomentarlo.

L'utilità del modello dipende dalla possibilità di generare valore sui dati, valore che viene restituito alla collettività tramite tasse, ecc.
Credo che questo possa avvenire se i dati diventano la base di un nuovo mercato di servizi a valore aggiunto. Servizi mobili e intelligenti che sfruttino l'ecosistema informativo per selezionare e aggregare, per filtrare e personalizzare, per "lavorare" i dati in modo da renderli utili a scopi specifici. Un mercato di micro applicazioni e di data-based services. Se il sistema funziona genera crescita e sviluppo, ma si può sviluppare solo se i dati sono utilizzabili a fini commerciali.
Credo che questo mercato sia già una realtà - semplificando, google e naviteq ne sono un esempio - ma sono convinto che l'apertura dei dati in generale e la libertà dei dati pubblici in particolare siano una fonte essenziale di innovazione. Un stimolo alla trasparenza in quello che all'oggi è un marcato opaco e alle volte basato su monopoli e privilegi. Se i dati di tutti sono a disposizione di tutti perché li utilizzino, innestiamo trasparenza e ci ri-appropriamo di un bene comune che abbiamo contribuito a creare.

Ovviamente non esiste solo un valore economico diretto ma un ampio spettro di esternalità che non riguardano direttamente la commerciabilità dei dati. La società civile deve avere quei dati; i giornali pure. Credo che l'accesso ai dati pubblici debba essere un diritto.

La discussione è in corso. L'alternativa potrebbe essere la clausola ricorsiva stile GPL o CC sharealike. Si riproporrebbe la distinzione free/open source e ci si garantirebbe dall'appropriazione privata dell'informazione pubblica. Ipotesi credo interessante e da esplorare ma che comunque in entrambi i casi consente l'utilizzo commerciale.
In sintesi non-commerciale dovrebbe essere l'ultima scelta.

Credo che il tema sia caldo e sarei felice di discuterne con tutti.
ciao, l.

Alberto Cottica

unread,

Nov 9, 2010, 6:00:40 AM11/9/10

to spaghett...@googlegroups.com

Lorenzo, lo scrivevo in questa mailing list qualche tempo fa, probabilmente prima che tu ti iscrivessi: senza nulla togliere all'importanza del dibattito teorico, ho partecipato alla sessione sugli Open Data di Picnic 10 (http://www.picnicnetwork.org/program/sessions/open-data-special-a-how-to-from-the-trenches.html) e alla domanda secca "Potete citare qualche caso di successo di business privato basato su dati liberati dalla pubblica amministrazione?" sono stati portati esattamente zero esempi. Alcune "cool apps", qualcuno che fa un po' di Adsense su pagine che contengono le previsioni del tempo, niente che ribalti la storia dell'economia mondiale. Quindi va benissimo, discutiamone, ma siamo consapevoli che, almeno in questa fase, non è un problema particolarmente presssante.

Ti faccio una domanda. Cos'hai in mente quando parli di esternalità? Io penso al dibattito informato sulle scelte di policy, e alla partecipazione dei cittadini alla governance, stile Wikicrazia; ma ho la sensazione che tu abbia in mente tutt'altro. Puoi chiarire meglio?

Lorenzo Benussi

unread,

Nov 9, 2010, 12:17:17 PM11/9/10

to spaghett...@googlegroups.com

Caro Alberto, sono argomenti a cui penso spesso e mi fa molto piacere discuterne.

Il giorno 09/nov/2010, alle ore 12.00, Alberto Cottica ha scritto:
> Lorenzo, lo scrivevo in questa mailing list qualche tempo fa, probabilmente prima che tu ti iscrivessi:

Si in effetti non l'avevo letto, sorry

> senza nulla togliere all'importanza del dibattito teorico, ho partecipato alla sessione sugli Open Data di Picnic 10 (http://www.picnicnetwork.org/program/sessions/open-data-special-a-how-to-from-the-trenches.html) e alla domanda secca "Potete citare qualche caso di successo di business privato basato su dati liberati dalla pubblica amministrazione?" sono stati portati esattamente zero esempi. Alcune "cool apps", qualcuno che fa un po' di Adsense su pagine che contengono le previsioni del tempo, niente che ribalti la storia dell'economia mondiale.

Oggi è così, anche a me non viene in mente un esempio "limpido" ma li sto cercando e mi sembra che qualcosa ci sia anche se poco evidente. Caselex (http://www.caselex.com/pageabout.html) può essere un esempio. Ma non è detto che non ce ne siano altri.
Mi sono occupato molto di free/open source e mi sembra si ripropongano li stessi temi. Anche qui i dati non sono l'oggetto diretto del modello di business ma la base per il servizio a valore aggiunto. Come per il SW anche per i dati, il contributo (tipicamente personalizzazione) privato si innesta sul bene comune (dati, software) - dwarfs standing on the shoulders of giants. Frose guardiamo nella direzione sbagliata oppure vogliamo semplicemente trovare un modello "diretto" invece che "indiretto". Personalmente sto cercando di capire meglio.

> Quindi va benissimo, discutiamone, ma siamo consapevoli che, almeno in questa fase, non è un problema particolarmente presssante.

Non pressante ma, credo, importante. Se si afferma un modello open data senza utilizzi commerciali rischiamo che passi l'idea che i dati non hanno un valore, o peggio, se esiste del valore questo non deve essere utilizzato dei privati.

>
> Ti faccio una domanda. Cos'hai in mente quando parli di esternalità? Io penso al dibattito informato sulle scelte di policy, e alla partecipazione dei cittadini alla governance, stile Wikicrazia; ma ho la sensazione che tu abbia in mente tutt'altro. Puoi chiarire meglio?

Non penso di avere in mente qualcosa d'altro, penso solo che ci può essere di più che le sole esternalità. Il tema mi perseguita ;) ed è ovviamente legato alla commerciabilità. Cerco di sintetizzare al massimo e spero di spiegarmi.
Il dibattito e la partecipazione sono senz'altro esternalità positive, insieme all'accoppiata accountability and transparency probabilmente gli effetti più importanti di open data (o meglio open gov). Tutto questo genera (almeno lo speriamo tutti) un governo più efficace e efficiente e rafforza la democrazia (data.gov docet); indirettamente si genera crescita economica perché le cose funzionano meglio e tutti ne beneficiamo.
Esternalità positive sono anche i budget statali trasparenti che permetto di controllare la spesa pubblica o le dichiarazioni dei redditi che aiutano a combattere l'evasione. Tutte esternalità positive.

Ma c'è qualcosa di più. Se ragioniamo solo dal lato pubblico rischiamo di dimenticarci del valore dei dati sul mercato. Se sono uno sviluppatore e voglio mettere in relazione i dati sull'agricoltura in Piemonte (vino e affini) con i dati sul turismo (agriturismi nelle Langhe) e magari anche con i dati ambientali (livelli di inquinamento delle zone vinicole) per proporre una nuova etichetta "informativa" che tramite QRcode (o simili) mi comunichi la storia della bottiglia di vino con tutti i dati che la compongono, devo avere accesso ai dati. Ho necessità di avere i dati e poterli utilizzare. Magari mi serviranno per vendere più vino e perciò non costituiscono un servizio diretto ma sicuramente aggiungono valore a un'attività esistente Cose di questo tipo esistano già ma si basano su dati episodici, qualcosa raccolto quà e là. Io vorrei invece si basassero su un flusso, stabile e prevedibile, che permetta continuità e faciliti la nascita di un nuovo mercato.

Se ci dimentichiamo di questo mondo "commerciale", perdiamo una parte importante del valore del modello.

ciao, l.

Matteo Brunati

unread,

Nov 10, 2010, 9:03:46 AM11/10/10

to spaghett...@googlegroups.com

> Ma c'� qualcosa di pi�. Se ragioniamo solo dal lato pubblico rischiamo di

> dimenticarci del valore dei dati sul mercato. Se sono uno sviluppatore e
> voglio mettere in relazione i dati sull'agricoltura in Piemonte (vino e
> affini) con i dati sul turismo (agriturismi nelle Langhe) e magari anche
> con i dati ambientali (livelli di inquinamento delle zone vinicole) per
> proporre una nuova etichetta "informativa" che tramite QRcode (o simili)
> mi comunichi la storia della bottiglia di vino con tutti i dati che la

> compongono, devo avere accesso ai dati. Ho necessit� di avere i dati e
> poterli utilizzare. Magari mi serviranno per vendere pi� vino e perci� non

> costituiscono un servizio diretto ma sicuramente aggiungono valore a

> un'attivit� esistente Cose di questo tipo esistano gi� ma si basano su
> dati episodici, qualcosa raccolto qu� e l�. Io vorrei invece si basassero
> su un flusso, stabile e prevedibile, che permetta continuit� e faciliti la

> nascita di un nuovo mercato.
>
> Se ci dimentichiamo di questo mondo "commerciale", perdiamo una parte
> importante del valore del modello.

Davvero gran bell'esempio, parte dell'integrazione tra marketing e open
data con l'ineternet of things sullo sfondo.

Qui c'� l'intersezione tra open data e pragmatismo per snellire il
processo di trasparenza etica abilitato dalla CSR, mi vien da dire. O
meglio per non pi� nascondersi solo dietro n livelli di certificazioni e
snellire l'intero processo in forme pi� utili e sotto il controllo della
popolazione.

Una delle cose sulle quali sto riflettendo da mesi per inciso, in effetti,
e che saranno riprese da metafora.it.

Negli USA esiste il sito goodguide.com che raccoglie dati sugli
ingredienti e su n elementi delle cose che si usano tutti i giorni. (
partito come no profit poi finanziato da n enti vari )

> http://www.goodguide.com/

"GoodGuide provides the world�s largest and most reliable source of
information on the health, environmental, and social impacts of consumer
products."

Tra l'altro nel loro manifesto esiste un esplicito riferimento agli open
data:

> http://www.goodguide.com/topics/2009/3/26/goodguide-transparency-manifesto

"We call on the government to mandate disclosure of critical information
for our health and safety.

The U.S. Government should mandate that food manufacturers disclose all
information through a public database to be managed by the Food and Drug
Administration (or a new Food Safety Agency). An open data feed of this
information should be made available to the public.

The government should develop an open data feed for real-time recalls that
can be accessed by retailers throughout the country. Retailers should use
UPC or RFID technologies, coupled with their sales data (matched to
shopper�s loyalty cards) to alert anyone who has purchased a recalled
product; and to block customers from purchasing recalled products if a
store has not yet pulled them from their shelves.

The government should �open source� Hazard Analysis and Critical Control
Points (HACCP), a plan intended to identify and prevent potential hazards
associated with food, so that the public can evaluate their quality, akin
to the way �the crowd� evaluates the quality of Wikipedia entries.

The government should implement an electronic tracing system for all food
sold in the U.S. so that manufacturers, retailers, and the public are able
to track food products back to their source, particularly whenever there
is a contamination problem."

Ero entrato in contatto con Sam Sethi, del W3C per la parte social, sul
tema e abbiamo iniziato a confrontarci. E' particolarmente attento a
questi flussi anche adesso in effetti.

> https://twitter.com/ssethi/status/29385300096

".Dear @GoodGuide when will you start providing information on UK/EU based
goods and services"

Siti come quello di goodguide con open data presenti nella filiera sono a
portata di mano anche per l'Europa?

Aggiungo un po' di risorse utili in generale per il lato economico, se non
le avete gi� viste, ne sto raccogliendo un po' :

> http://wiki.open.org.nz/Economic_Benefits_of_Open_Data
> http://govinthelab.com/the-roi-of-open-government-data-new-jobs/
> http://www.istrategylabs.com/2008/11/apps-for-democracy-yeilds-4000-roi-in-30-days-for-dcgov/
> http://opensf.wordpress.com/2009/07/13/measuring-roi-of-gov-2-0-efforts/
> http://www.volans.com/lab/projects/the-transparent-economy/open-com-collaborative-reporting-open-data/

Matt

Reply all

Reply to author

Forward