________________________________________
Da: spaghett...@googlegroups.com [spaghett...@googlegroups.com] per conto di Alberto [alberto...@gmail.com]
Inviato: venerdì 5 novembre 2010 21.10
A: Spaghetti Open Data
Oggetto: Friendly fire dagli amici stranieri, ma anche una critica (giusta)
Curiosando in rete ho trovato, tra commenti generalmente positivi, un post abbastanza critico della nostra iniziativa: http://www.titticimmino.com/2010/11/05/opendata-opengov-e-spaghetti-allitaliana-part-1/ Tra le critiche che vengono mosse, ce n'è una che condivido, e cioè che i dati in PDF non si possono davvero considerare aperti, per quanto ampia possa essere l'accezione della parola. Uno dei dataset di SOD ("conto annuale RGS") è appunto solo in formato PDF. Che dite, lo togliamo? Grazie a Titti CImmino, l'autrice del post, per la segnalazione. La ringrazio qui perché è iscritta alla mailing list. :-) A.
So, I thought it makes sense to revisit some (more or less) well-known data formats and services and try to pin down what “in the Web” means – a first step to measure how well-integrated they are with the Web. I’ll call the degree of how “much” they are in the Web the Link factor in the following. I suggest that the Link factor ranges from -2 (totally “on the Web”) to +2 (totally “in the Web), with the following attempt of a definition for the scale:
-2 … proprietary, desktop-centric document formats -1 … structured data that can be exposed and accessed via Web 0 … standardised, Web-aligned (XML-based) formats or Web services 1 … open, standardised (document) formats 2 … full REST-compliant, open (data) standards natively supporting links
Here is what I’ve so far – feel free to ping me if you disagree or have some other suggestions:
Technology | Examples | Link factor |
Documents | MS Word, PDF | -2 |
Spreadsheets | MS Excel | -1 |
RDBMS | Oracle DB, MySQL | -1 |
NoSQL | BigTable, HBase, Amazon S3, etc. | 0 |
Hypertext and Hypermedia | HTML, VoiceML, SVG, Google Docs | 1 |
Hyperdata | Atom, OData, Linked Data | 2 |
La domanda è: è utile aggregare anche tali dati pubblici ma non aperti per creare domanda sui dati aperti?
E' utile inserirli per stimolarne l'estrazione in formato open e riutilizzabile?
Riporto una porzione del commento di Titti (
http://www.titticimmino.com/2010/11/05/opendata-opengov-e-spaghetti-allitaliana-part-1/
) che � in topic:
"Sono d�accordo con Matteo e con quanti ritengono che mostrare i dati che
sono rilasciati PUBBLICI e non open debbano avere visibilit�, ma per
favore non mettiamoli nel � �.�opendata: non facciamo commistione."
In effetti a questo punto forse � il caso di creare una sezione, magari
tramite un blog e una pagina "Dati pubblici" e rinominare l'attuale "Dati"
con "Open Data" ( e qui chi si era offerto di dare una mano magari pu�
tornarci utile ) per mostrare questa differenza abilitando una discussione
mirata.
Qui in realt� se volevamo partire direttamente facendo solo Open Data
puri, che � quello che ha provato a dire Titti quando � entrata in lista,
solo il Piemonte e Linked Open Camera potevamo inserire di fatto. Per non
parlare del fatto che senza una licenza chiara che abiliti il riuso non li
riterrei open data per ovvi motivi impliciti.
Per cui il dilemma implicito era, come era emerso: bisogna sia mostrare i
dati sia crearne domanda.
In una tale situazione il compromesso storico credo sia stata l'unica via
possibile per non piantarsi ed infatti � quella che ho sempre interpretato
implicitamente nel proseguire naturale delle discussioni.
Non a caso spaghetti � un termine usato in programmazione ( spaghetti code
) per indicare il caos di codice senza un design chiaro a monte. Uno
spaghetti code... Questa � la situazione italiana non solo sugli open
data, ma credo attorno ad una grossa fetta della cultura digitale.
Quindi io ho sempre visto il passaggio di spaghetti open data un utile ma
coerente step intermedio di incoerenza tecnica per far emergere il caos
italico, se mi volete accettare la licenza poetica dell'interpretazione.
E questo credo riconosca anche il livello di incomprensioni presente qui
in lista, a vario titolo ed in vari momenti. Ma io la vedo positivamente,
perch� possiamo imparare assai gli uni dagli altri, dalle competenze di
uno rispetto ad un altro.
E la cosa migliore per farlo � rendendo pubblica tale dialettica e tale
trasformazione in corso d'opera. Non siamo un popolo di creativi ed
eccentrici d'altronde? .)
Per chiudere, questa la proposta al momento a questo punto:
- associare un blog a spaghetti open data per valorizzare in maniera
semplice questo percorso in atto, e spiegarne gli step per insegnare dal
nostro confronto cosa sta emergendo per capire dall'interno cosa sono gli
open data e non solo da una definizione, che a questo punto � il caso da
fare per bene
- creare due voci dai dati attuali:
1. Dati pubblici
2. Dati aperti ( o Open Data )
Senza contare che nella fase di raccolta sono stati segnalati anche
servizi Web puri ( tipo il discorso delle elezioni e dei relativi archivi
), che � il modo tradizionale di far navigare i dati senza perderne il
controllo.
E la forma pi� comune di pensare ai dati via Web.
Siano essi fruibili in PDF o tramite tabelle HTML poco importa. Non � il
concetto degli Open Data.
A questo punto � utile farli emergere, anzi fondamentale tali differenze.
Ovviamente il tutto fa parte di un'interpretazione delle dinamiche e delle
parole usate fino ad oggi totalmente a mia discrezione, e potrei
sbagliarmi of course.
La cosa importante � che dalle differenze possiamo creare valore stavolta.
Cosa ne dite di questo sunto?
Ovviamente il tutto in un percorso anche tecnico per normalizzare la
situazione e passare a CKAN con i crismi del caso, come diciamo da tempo e
forse adesso ne abbiamo maggiormente capito il valore, anche di struttura
e di coerenza di stile.
Questa almeno � la differenza attuale anche di sostanza tra it.ckna.net e
spaghettiopendata.org, a mio avviso non certo inutile.
Valorizziamo tale percorso?
Matt
-----Messaggio originale-----
Da: spaghett...@googlegroups.com [mailto:spaghett...@googlegroups.com] Per conto di Alberto
Inviato: lunedì 8 novembre 2010 12.27
A: Spaghetti Open Data
Oggetto: Re: Friendly fire dagli amici stranieri, ma anche una critica (giusta)
Matteo, credo che abbiamo capito tutti che l'apertura dei dati è una
variabile continua e non discreta. Per quanto mi riguarda, se ci posso
pasticciare senza reimmetterli a mano, mi va ancora bene. Per esempio,
DPSeXplorer ha solo un'interfaccia web, ma io la posso interrogare,
farci grafici di vario tipo, dopodiche se trovo una roba sensata
faccio uno screengrab e lo sbatto sul blog. Non è certo il massimo, ma
c'è un grado di apertura. Con i dati in PDF non ci posso fare niente.
Quindi io propongo di abbassare l'asticella per escludere le basi dati
disponibili solo in PDF. Poi, ovviamente, mi rimetto alla saggezza del
gruppo. :-)
Quanto al blog, sarebbe bellissimo, ma io dico fin d'ora che non ho
tempo di scriverci. Probabilmente aggiungerei - questo sì - una FAQ
Buona l'idea della stellina! È il tipo di rinforzo positivo che mi piace usare nelle mie cose.
Ottimo Irene, grazie .)
Avevo dimenticato queste stelline, davvero mitiche: allora provo con le
stelline.
Domani sera le inserisco e mettiamo una legenda relativa e vediamo come
viene.
Matt