Anche io sono d'accordo con la stellina.
Anzi, se vogliamo andare nella direzione dei linked open data (e non semplicemente degli open data), potremmo riutilizzare le stelline di tim Berners-Lee:
http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
Ovvero, una scala da 1 a 5 stelle per indicare *quanto* aperto (e linkato) è uno specifico dataset.
HTH,
IreneIl giorno 08 novembre 2010 12:40, Alberto Cottica <alb...@cottica.net> ha scritto:
Buona l'idea della stellina! È il tipo di rinforzo positivo che mi piace usare nelle mie cose.
--
" If you understand what you're doing,
you're not learning anything. "
Un tema mi pare gi� emerso: direi entrambi in realt� di fatto. Utili per
fini diversi, ma complementari nelle loro sinergie. Qui forse ha maggior
peso la seconda, ma sono alla pari direi.
Ed infatti molte delle segnalazioni riguardano dati del secondo tipo, ma
anche sul primo ( soprattutto a livello di operato e investimento ).
> 2 - "linkability": open data o open meta data? Ne parler� Paolo di
> Pietro il 20 a Senigaglia, ma avendo lavorato con lui proprio alla
> modellazione XSD dei web services dei servizi della pubblica
> amministrazione locale, credo davvero che non sia sufficiente
> "liberare" i dati perch� questi siano utili all'utente; se, cio�, non
> si stabilisce una grammatica d'uso standard che li renda disponibili
> dai santuari delle applicazioni/gestionali verticali (anche se SOA).
>
Ottimo, sar� una discussione interessante quella che emerger� a Senigallia
per i tecnici. E qui per non scendere troppo nel dettaglio direi che sia
il caso di citare un concetto: quello di Linked Data.
"Linked Data is a sub-topic of the Semantic Web. The term Linked Data is
used to describe a method of exposing, sharing, and connecting data via
dereferenceable URIs on the Web." via Wikipedia.
Quello che qui interviene � il ruolo delle ontologie e del modello comune
indipendente dei dati che tratto, che � RDF, e qui se vogliamo
approfondire sia Irene che Titti sono assai pi� ferrate di me
sull'argomento .)
Quello che volevo aggiungere io � il concetto di dato raggiungibile via
Web attraverso un percorso HTTP che conosciamo bene, sia se parlo del
dataset che del singolo dato del dataset in realt�... Questo � uno degli
elementi forse davvero dirompenti per quanto riguarda la differenza tra le
chiamate tra web services classiche ( e quindi il dilemma dei formati dei
dati ) ed il processo semantico e linked data...
Se uso percorsi URL tipo per dire di cosa parlano i dati, posso poi dire
che certe cose sono dei sinonimi in realt� semplicemente aggiungendo meta
informazione man mano che mi serve...
Questo � breve ma lampante nell'impostazione direi in merito:
> http://www.w3.org/TR/gov-data/
Sar� interessante unire tale dinamica con quello che � stato fatto dal
progetto italiano Linked Open Camera e vedere il confronto che nasce per
capire i retroscena e farli capire anche ai non tecnici...
Elemento fondamentale questo.
Qui una veloce discussione sul tema che trovo on topic:
> http://www.innovatoripa.it/posts/2010/11/1508/open-data-vs-valid-data-and-open-data-what
Matt
> Alberto, se posso aggiungere i miei due cent, no, non dici affatto scemenze, ma credo che ci siano un certo numero di dimensioni "semantiche" della faccenda che non possono essere affrontate tutte insieme.
>
> 0) la tipologia di dati (finanziamenti vs. dati geografici vs. elenchi di soggetti giuridici, ecc.)
> 1) il formato dei dati e il loro livello di linkabilità (le 5 stelle di cui dicevo in un'altra mail)
> 2) l'origine dei dati (governativa vs. pubblica come faceva notare Pietro all'inizio del thread)
> 3) la qualità dei dati (prodotti manualmente vs. estratti in automatico da qualche sorgente diversa, ecc.)
> 4) l'aggiornamento o in generale la validità temporale dei dati (dati del 2010 vs. dati del 1999, ecc.)
> 5) ecc.
5) la granularità con cui sono presentati
6) la licenza con cui sono rilasciati
continuo a vedere una gran confusione.. attenzione perché si va alla deriva e si perde il meglio che c'è in questa lista
_________________________
Titti Cimmino
http://titticimmino.com
http://twitter.com/titticimmino
http://identi.ca/titticimmino/
iChat tittic...@mac.com
skype id: zen...zero
t...@titticimmino.com
tici...@gmail.com
mobile 1 +39 3339470791
mobile 2 +39 3469483969
tel 0818931230
fax 0818931230
Benritrovata Titti, � vero: facciamo un po' di ordine.
Lo step della raccolta di SOD ha una valenza meno rigorosa di quella del
CKAN ma ha avuto una curva di apprendimento minore iniziale.
Uno step necessario per avvicinare personale non tecnico a certe
dimensioni forse. Almeno questa � una mia sensazione, col senno di poi.
Meno rigore significa pi� confusione: ma la confusione almeno crea la
motivazione per fermarsi su certi punti.
Come diceva Paolo oggi in una bella sintesi, forse la maggiore utilit� di
SOD rientra proprio nel far emergere i dati pubblici e governativi che poi
possano rientrare a pieno titolo nel CKAN e nel rendere espliciti tali
passaggi, anche graficamente.
Dal punto di vista tecnico io e spero qualcun altro ( non prima del 20, ma
sicuramente dopo ) mi rendo disponibile a dare una mano per integrare
Exhibit con il CKAN italiano in modo da sfruttarlo come backend in maniera
definitiva, per quello che riesco e come gi� avevo accennato, e
parallelamente mi piacerebbe l'idea di tenere in piedi SOD anche per
segnalare servizi e applicazioni Web che dovrebbero diventare raw data, e
quindi inseribili nel CKAN in un secondo tempo.
Sbaglio o tale dimensione si voleva fosse inserita anche nel CKAN in un
suo sviluppo successivo?
Nel qual caso, la sfruttiamo dall'inizio ovviamente.
Cosa ne dite?
Soprattutto sul valore di:
- tenere SOD per raccogliere anche dati pubblici con 0 stelline ( dati
frutto di interfacce web non esportabili ) per creare domanda di riuso e
di open data e mostrare le differenze rispetto a chi si muove meglio
- sfruttare questa nostra aggregazione di esperienze per mostrare meglio
quello che comporta un'innovazione tecnologica difficile da spiegare come
quella del Web of Data che valorizza gli Open Data usando il caso SOD
come racconto di miglioramento agile
- continuare a chiarire le idee in merito, che il tema � ampio. Nicola
Mattina aveva aperto un google site proprio per aggregare gli spunti che
emergono in lista ed organizzarli per non perderli e chiarirli sempre pi�
in effetti.
Matt
Credo che le caratteristiche da considerare siano tre:
1) tecnologia - i dati sono machine-readable?
2) licenza - posso utilizzarli per qualunque scopo?
3) prezzo - sono gratuiti?
Ognuna delle tre è importante e non credo si possa parlare di open data se i dati non hanno tutte e tre queste peculiarità.
Non credo che un pdf sia open data come non credo che una licenza non commerciale sia open data.
Sono però convinto che sia necessario ragionare anche per gradi e approssimazioni con interlocutori spesso difficili e dunque ben venga ogni tentativo di proporre il "modello" in senso ampio. Non posso che non supportare tutte le iniziative in questo senso, però, è necessario fare dei distinguo. Tra l'atro penso che l'open knowledge definition (in italiano qui http://www.opendefinition.org/okd/italiano/) sia un ottimo riferimento.
Nella mia esperienza di dati.piemonte le cose sono andate bene - per ora - perché stiamo cercando di fare qualcosa che "funzioni" seguendo il modello open data. Perché se tolgo, ad esempio, l'utilizzo commerciale viene a mancare il razionale economico (nel senso di applicazioni e servizi) e tutto si indebolisce. Oppure se dico che un pdf è open data, allora quando finalmente open data sarà legge avremo qualcuno che si sentirà in dovere di fornire pdf e nulla più.
Se vogliamo che open data funzioni o lo adottiamo al 100% oppure rischiamo di far nascere ibridi che hanno la tendenza a non funzionare.
Forse sarebbe necessario, ci penso da un po', pensare un Open Data Manifesto (seguendo i riferimenti OFK).
ciao, l.
Matteo,
concordo sull'importanza strategica di una visualizzazione amichevole e
credo che questo sia il grande merito di SOD, ma permettimi di esprimere
un diverso parere su due punti:
* CKAN Italia non è previsto per contenere informazioni ristrette
ai soli Linked Open Data - altrimenti ci sarebbe solo 1 dataset,
ovvero Linked Open Camera. Come abbiamo scritto nella
presentazione io e Federico Morando
http://blog.okfn.org/2010/06/14/launch-of-itckannet-for-open-data-in-italy/ l'obiettivo è quello di migliorare la comprensione dello stato dei dati pubblici in Italia. È sotto gli occhi di tutti noi che questa situazione non sia affatto buona, ma che al tempo stesso ci siano significativi margini di miglioramento negli ultimi tempi. Inoltre non chiudiamo la porta a dati di interesse pubblico che vengono da fonti esterne alla PA (es. per i dati geografici OpenStreetMap)
* non trovo che l'inserimento delle informazioni in CKAN sia molto
più complesso rispetto ad uno spreadsheet - in parte perché
trovo che il form sia più leggibile e in parte perché giocoforza
le informazioni che devono essere immesse sono molto simili.
Concordo tuttavia sull'importanza di un miglioramento a livello
di usabilità. Questa settimana io e Friedrich Lindenberg ci
occuperemo dell'upgrade alla versione più recente, mi rendo
disponibile dalla settimana prossima per una chat con Stefano
Durì che si era detto interessato all'inserimento dei dati e con
chiunque altro voglia iniziare a lavorare su CKAN
Trovo che tra critiche, opinioni diverse e passi avanti pratici stia
emergendo una via italiana agli open data che forse alcuni troveranno
persino inaspettata. Io credo che sia solo l'inizio.
Infine, chiedo scusa se a volte affronto alcuni temi in modo deciso e su
posizioni ferme (es. CKAN), questo è per me una conseguenza della
fiducia che ripongo nel progetto a lungo termine e nella visione di Open
Knowledge Foundation, di cui CKAN è solo uno dei molti strumenti di
azione.
Un saluto,
steko
--
Stefano Costa
Coordinator, Working Group on Open Data in Archaeology
http://wiki.okfn.org/wg/archaeology
The Open Knowledge Foundation
http://www.okfn.org · http://opendefinition.org/
Sono convinto che il buonsenso di tutti conduca a una sana
collaborazione e convergenza delle azioni.
CKAN è la "via" agli open data, e come dicevo all'inizio del thread
andrebbe solo reso meno ostico ai più. La notizia di Steko riguardo un
suo miglioramento dell'interfaccia è ottima.
SOD è tra le altre cose un progetto sociale, nel quale la gente possa
trovare oltre che un repository di dati pubblici (ribadisco: non
perché provenienti dalla PA ma perché pubblicamente disponibili in
rete, e talvolta anche aperti), anche tools per il loro utilizzo, e un
luogo di discussione, di confronto.
Buona serata,
Pietro
--
> Matteo,
> concordo sull'importanza strategica di una visualizzazione amichevole e
> credo che questo sia il grande merito di SOD, ma permettimi di esprimere
> un diverso parere su due punti:
> * CKAN Italia non è previsto per contenere informazioni ristrette
> ai soli Linked Open Data - altrimenti ci sarebbe solo 1 dataset,
> ovvero Linked Open Camera.
Ciao Stefano, grazie della delucidazione che fa sempre bene.
Tra l'altro mi sembra che SOD sia la realt� che di fatto auspicavate in un
certo senso:
"The key point is that national and regional governments own large
datasets that would be quite easily made available to the public. This
process would however require 3 distinct actors, as outlined in the Open
Data study by Becky Hogge:
* government heads
* civil servants (acting as the �middle layer�)
* a small but determined group of citizens (or �civic hackers�)
"
In effetti ci manca il primo punto, ma sul resto stiamo migliorando.
> Concordo tuttavia sull'importanza di un miglioramento a livello
> di usabilità. Questa settimana io e Friedrich Lindenberg ci
> occuperemo dell'upgrade alla versione più recente, mi rendo
> disponibile dalla settimana prossima per una chat con Stefano
> Durì che si era detto interessato all'inserimento dei dati e con
> chiunque altro voglia iniziare a lavorare su CKAN
>
Ottimo: io mi rendo disponibile per potenziali mashup usando Exhibit e
similari, ma questo dopo il 20 in ogni caso. Ed intanto mi studio un po'
l'organizzazione semantica che avete adottato, ed ai vocabolari in uso dal
ckan, grazie anche alle segnalazioni di Titti in merito che mi ha fatto.
> Trovo che tra critiche, opinioni diverse e passi avanti pratici stia
> emergendo una via italiana agli open data che forse alcuni troveranno
> persino inaspettata. Io credo che sia solo l'inizio.
Gi� e questo � un passo positivo, assolutamente.
>
> Infine, chiedo scusa se a volte affronto alcuni temi in modo deciso e su
> posizioni ferme (es. CKAN), questo è per me una conseguenza della
> fiducia che ripongo nel progetto a lungo termine e nella visione di Open
> Knowledge Foundation, di cui CKAN è solo uno dei molti strumenti di
> azione.
>
E fai bene: OKF � il nostro faro in effetti su molteplici temi.
Matt
L'utilità del modello dipende dalla possibilità di generare valore sui dati, valore che viene restituito alla collettività tramite tasse, ecc.
Credo che questo possa avvenire se i dati diventano la base di un nuovo mercato di servizi a valore aggiunto. Servizi mobili e intelligenti che sfruttino l'ecosistema informativo per selezionare e aggregare, per filtrare e personalizzare, per "lavorare" i dati in modo da renderli utili a scopi specifici. Un mercato di micro applicazioni e di data-based services. Se il sistema funziona genera crescita e sviluppo, ma si può sviluppare solo se i dati sono utilizzabili a fini commerciali.
Credo che questo mercato sia già una realtà - semplificando, google e naviteq ne sono un esempio - ma sono convinto che l'apertura dei dati in generale e la libertà dei dati pubblici in particolare siano una fonte essenziale di innovazione. Un stimolo alla trasparenza in quello che all'oggi è un marcato opaco e alle volte basato su monopoli e privilegi. Se i dati di tutti sono a disposizione di tutti perché li utilizzino, innestiamo trasparenza e ci ri-appropriamo di un bene comune che abbiamo contribuito a creare.
Ovviamente non esiste solo un valore economico diretto ma un ampio spettro di esternalità che non riguardano direttamente la commerciabilità dei dati. La società civile deve avere quei dati; i giornali pure. Credo che l'accesso ai dati pubblici debba essere un diritto.
La discussione è in corso. L'alternativa potrebbe essere la clausola ricorsiva stile GPL o CC sharealike. Si riproporrebbe la distinzione free/open source e ci si garantirebbe dall'appropriazione privata dell'informazione pubblica. Ipotesi credo interessante e da esplorare ma che comunque in entrambi i casi consente l'utilizzo commerciale.
In sintesi non-commerciale dovrebbe essere l'ultima scelta.
Credo che il tema sia caldo e sarei felice di discuterne con tutti.
ciao, l.
Il giorno 09/nov/2010, alle ore 12.00, Alberto Cottica ha scritto:
> Lorenzo, lo scrivevo in questa mailing list qualche tempo fa, probabilmente prima che tu ti iscrivessi:
Si in effetti non l'avevo letto, sorry
> senza nulla togliere all'importanza del dibattito teorico, ho partecipato alla sessione sugli Open Data di Picnic 10 (http://www.picnicnetwork.org/program/sessions/open-data-special-a-how-to-from-the-trenches.html) e alla domanda secca "Potete citare qualche caso di successo di business privato basato su dati liberati dalla pubblica amministrazione?" sono stati portati esattamente zero esempi. Alcune "cool apps", qualcuno che fa un po' di Adsense su pagine che contengono le previsioni del tempo, niente che ribalti la storia dell'economia mondiale.
Oggi è così, anche a me non viene in mente un esempio "limpido" ma li sto cercando e mi sembra che qualcosa ci sia anche se poco evidente. Caselex (http://www.caselex.com/pageabout.html) può essere un esempio. Ma non è detto che non ce ne siano altri.
Mi sono occupato molto di free/open source e mi sembra si ripropongano li stessi temi. Anche qui i dati non sono l'oggetto diretto del modello di business ma la base per il servizio a valore aggiunto. Come per il SW anche per i dati, il contributo (tipicamente personalizzazione) privato si innesta sul bene comune (dati, software) - dwarfs standing on the shoulders of giants. Frose guardiamo nella direzione sbagliata oppure vogliamo semplicemente trovare un modello "diretto" invece che "indiretto". Personalmente sto cercando di capire meglio.
> Quindi va benissimo, discutiamone, ma siamo consapevoli che, almeno in questa fase, non è un problema particolarmente presssante.
Non pressante ma, credo, importante. Se si afferma un modello open data senza utilizzi commerciali rischiamo che passi l'idea che i dati non hanno un valore, o peggio, se esiste del valore questo non deve essere utilizzato dei privati.
>
> Ti faccio una domanda. Cos'hai in mente quando parli di esternalità? Io penso al dibattito informato sulle scelte di policy, e alla partecipazione dei cittadini alla governance, stile Wikicrazia; ma ho la sensazione che tu abbia in mente tutt'altro. Puoi chiarire meglio?
Non penso di avere in mente qualcosa d'altro, penso solo che ci può essere di più che le sole esternalità. Il tema mi perseguita ;) ed è ovviamente legato alla commerciabilità. Cerco di sintetizzare al massimo e spero di spiegarmi.
Il dibattito e la partecipazione sono senz'altro esternalità positive, insieme all'accoppiata accountability and transparency probabilmente gli effetti più importanti di open data (o meglio open gov). Tutto questo genera (almeno lo speriamo tutti) un governo più efficace e efficiente e rafforza la democrazia (data.gov docet); indirettamente si genera crescita economica perché le cose funzionano meglio e tutti ne beneficiamo.
Esternalità positive sono anche i budget statali trasparenti che permetto di controllare la spesa pubblica o le dichiarazioni dei redditi che aiutano a combattere l'evasione. Tutte esternalità positive.
Ma c'è qualcosa di più. Se ragioniamo solo dal lato pubblico rischiamo di dimenticarci del valore dei dati sul mercato. Se sono uno sviluppatore e voglio mettere in relazione i dati sull'agricoltura in Piemonte (vino e affini) con i dati sul turismo (agriturismi nelle Langhe) e magari anche con i dati ambientali (livelli di inquinamento delle zone vinicole) per proporre una nuova etichetta "informativa" che tramite QRcode (o simili) mi comunichi la storia della bottiglia di vino con tutti i dati che la compongono, devo avere accesso ai dati. Ho necessità di avere i dati e poterli utilizzare. Magari mi serviranno per vendere più vino e perciò non costituiscono un servizio diretto ma sicuramente aggiungono valore a un'attività esistente Cose di questo tipo esistano già ma si basano su dati episodici, qualcosa raccolto quà e là. Io vorrei invece si basassero su un flusso, stabile e prevedibile, che permetta continuità e faciliti la nascita di un nuovo mercato.
Se ci dimentichiamo di questo mondo "commerciale", perdiamo una parte importante del valore del modello.
ciao, l.
> Ma c'� qualcosa di pi�. Se ragioniamo solo dal lato pubblico rischiamo di
> dimenticarci del valore dei dati sul mercato. Se sono uno sviluppatore e
> voglio mettere in relazione i dati sull'agricoltura in Piemonte (vino e
> affini) con i dati sul turismo (agriturismi nelle Langhe) e magari anche
> con i dati ambientali (livelli di inquinamento delle zone vinicole) per
> proporre una nuova etichetta "informativa" che tramite QRcode (o simili)
> mi comunichi la storia della bottiglia di vino con tutti i dati che la
> compongono, devo avere accesso ai dati. Ho necessit� di avere i dati e
> poterli utilizzare. Magari mi serviranno per vendere pi� vino e perci� non
> costituiscono un servizio diretto ma sicuramente aggiungono valore a
> un'attivit� esistente Cose di questo tipo esistano gi� ma si basano su
> dati episodici, qualcosa raccolto qu� e l�. Io vorrei invece si basassero
> su un flusso, stabile e prevedibile, che permetta continuit� e faciliti la
> nascita di un nuovo mercato.
>
> Se ci dimentichiamo di questo mondo "commerciale", perdiamo una parte
> importante del valore del modello.
Davvero gran bell'esempio, parte dell'integrazione tra marketing e open
data con l'ineternet of things sullo sfondo.
Qui c'� l'intersezione tra open data e pragmatismo per snellire il
processo di trasparenza etica abilitato dalla CSR, mi vien da dire. O
meglio per non pi� nascondersi solo dietro n livelli di certificazioni e
snellire l'intero processo in forme pi� utili e sotto il controllo della
popolazione.
Una delle cose sulle quali sto riflettendo da mesi per inciso, in effetti,
e che saranno riprese da metafora.it.
Negli USA esiste il sito goodguide.com che raccoglie dati sugli
ingredienti e su n elementi delle cose che si usano tutti i giorni. (
partito come no profit poi finanziato da n enti vari )
"GoodGuide provides the world�s largest and most reliable source of
information on the health, environmental, and social impacts of consumer
products."
Tra l'altro nel loro manifesto esiste un esplicito riferimento agli open
data:
> http://www.goodguide.com/topics/2009/3/26/goodguide-transparency-manifesto
"We call on the government to mandate disclosure of critical information
for our health and safety.
The U.S. Government should mandate that food manufacturers disclose all
information through a public database to be managed by the Food and Drug
Administration (or a new Food Safety Agency). An open data feed of this
information should be made available to the public.
The government should develop an open data feed for real-time recalls that
can be accessed by retailers throughout the country. Retailers should use
UPC or RFID technologies, coupled with their sales data (matched to
shopper�s loyalty cards) to alert anyone who has purchased a recalled
product; and to block customers from purchasing recalled products if a
store has not yet pulled them from their shelves.
The government should �open source� Hazard Analysis and Critical Control
Points (HACCP), a plan intended to identify and prevent potential hazards
associated with food, so that the public can evaluate their quality, akin
to the way �the crowd� evaluates the quality of Wikipedia entries.
The government should implement an electronic tracing system for all food
sold in the U.S. so that manufacturers, retailers, and the public are able
to track food products back to their source, particularly whenever there
is a contamination problem."
Ero entrato in contatto con Sam Sethi, del W3C per la parte social, sul
tema e abbiamo iniziato a confrontarci. E' particolarmente attento a
questi flussi anche adesso in effetti.
> https://twitter.com/ssethi/status/29385300096
".Dear @GoodGuide when will you start providing information on UK/EU based
goods and services"
Siti come quello di goodguide con open data presenti nella filiera sono a
portata di mano anche per l'Europa?
Aggiungo un po' di risorse utili in generale per il lato economico, se non
le avete gi� viste, ne sto raccogliendo un po' :
> http://wiki.open.org.nz/Economic_Benefits_of_Open_Data
> http://govinthelab.com/the-roi-of-open-government-data-new-jobs/
> http://www.istrategylabs.com/2008/11/apps-for-democracy-yeilds-4000-roi-in-30-days-for-dcgov/
> http://opensf.wordpress.com/2009/07/13/measuring-roi-of-gov-2-0-efforts/
> http://www.volans.com/lab/projects/the-transparent-economy/open-com-collaborative-reporting-open-data/
Matt