Friendly fire dagli amici stranieri, ma anche una critica (giusta)

12 views
Skip to first unread message

Alberto

unread,
Nov 5, 2010, 4:10:54 PM11/5/10
to Spaghetti Open Data
Ciao a tutti,

ho mandato un paio di mail ad amici che si occupano di queste cose in
altri paesi. Per ora i riscontri sono questi:

- post sul blog di Personal Democracy Forum Europe:

http://personaldemocracy.com/blog-entry/spaghetti-open-data-little-thing-feels-right

- post sul blog di opensource.com (è un blog gestito da Red Hat
rivolto alla comunità di sviluppatori e utenti open source)

http://opensource.com/government/10/11/spaghetti-open-data-little-thing-feels-right

- Ton Zijlstra mi ha scritto che stava seguendo l'iniziativa dal mio
primo post, e mi ha assicurato che la riprenderà sia dal suo blog
personale che da un altro paio di siti, tra cui http://epsiplatform.eu/,
che è il sito ufficiale della Commissione Europea sugli open data.

- Paul Johnston mi ha suggerito di scrivere ad Andrea Di Maio. Non ci
avevo pensato! Ma adesso l'ho fatto, vediamo cosa dice Andrea.

Curiosando in rete ho trovato, tra commenti generalmente positivi, un
post abbastanza critico della nostra iniziativa:

http://www.titticimmino.com/2010/11/05/opendata-opengov-e-spaghetti-allitaliana-part-1/

Tra le critiche che vengono mosse, ce n'è una che condivido, e cioè
che i dati in PDF non si possono davvero considerare aperti, per
quanto ampia possa essere l'accezione della parola. Uno dei dataset di
SOD ("conto annuale RGS") è appunto solo in formato PDF. Che dite, lo
togliamo?

Grazie a Titti CImmino, l'autrice del post, per la segnalazione. La
ringrazio qui perché è iscritta alla mailing list. :-)

A.

Pennisi Aline

unread,
Nov 5, 2010, 4:25:42 PM11/5/10
to spaghett...@googlegroups.com
io sono d'accordo per togliere dati in PDF
e anche per creare un pò di pressione affinché tutti i dati siano anche scaricabili in versione CSV


________________________________________
Da: spaghett...@googlegroups.com [spaghett...@googlegroups.com] per conto di Alberto [alberto...@gmail.com]
Inviato: venerdì 5 novembre 2010 21.10
A: Spaghetti Open Data
Oggetto: Friendly fire dagli amici stranieri, ma anche una critica (giusta)

Matteo Brunati

unread,
Nov 5, 2010, 4:42:01 PM11/5/10
to spaghett...@googlegroups.com

Curiosando in rete ho trovato, tra commenti generalmente positivi, un
post abbastanza critico della nostra iniziativa:

http://www.titticimmino.com/2010/11/05/opendata-opengov-e-spaghetti-allitaliana-part-1/

Tra le critiche che vengono mosse, ce n'è una che condivido, e cioè
che i dati in PDF non si possono davvero considerare aperti, per
quanto ampia possa essere l'accezione della parola. Uno dei dataset di
SOD ("conto annuale RGS") è appunto solo in formato PDF. Che dite, lo
togliamo?

Grazie a Titti CImmino, l'autrice del post, per la segnalazione. La
ringrazio qui perché è iscritta alla mailing list. :-)

A.
In merito alla questione tecnica, ho risposto online e la sinergia e la comunione di intenti ovviamente è fondamentale:

> http://www.dagoneye.it/blog/2010/11/05/spaghetti-open-data-e-online-ovvero-pian-piano-ci-si-muove/

In effetti al momento abbiamo dei dati pubblici e non Open inseriti in lista. ( almeno in 4 dataset ).

Avere un data.gov.it con una lista di siti con dati in pdf o via interfaccia web cosa può produrre?
Avere un data.gov.it con dati tutti in csv tipo dati.piemonte.it cosa produce?
Avere poi tutti i dati in xml? Produce quello che hanno fatto i ragazzi di Linked Open Camera.
E averli come Linked Open Data?

Luigi Reggi, qui in lista, mi aveva chiesto qualche giorno fa, un link che ritengo utile riproporre in tale contesto:

> http://webofdata.wordpress.com/2010/03/01/data-and-the-web-choices/

"

So, I thought it makes sense to revisit some (more or less) well-known data formats and services and try to pin down what “in the Web” means – a first step to measure how well-integrated they are with the Web. I’ll call the degree of how “much” they are in the Web the Link factor in the following. I suggest that the Link factor ranges from -2 (totally “on the Web”) to +2 (totally “in the Web), with the following attempt of a definition for the scale:

-2 … proprietary, desktop-centric document formats
-1 … structured data that can be exposed and accessed via Web
 0 … standardised, Web-aligned (XML-based) formats or Web services
 1 … open, standardised (document) formats
 2 … full REST-compliant, open (data) standards natively supporting links

Here is what I’ve so far – feel free to ping me if you disagree or have some other suggestions:

Technology Examples Link factor
Documents MS Word, PDF -2
Spreadsheets MS Excel -1
RDBMS Oracle DB, MySQL -1
NoSQL BigTable, HBase, Amazon S3, etc. 0
Hypertext and Hypermedia HTML, VoiceML, SVG, Google Docs 1
Hyperdata Atom, OData, Linked Data 2
"

La tabella dei formati ed il loro grado di "linkability", se mi accettate l'espressione.
Fondamentalmente un web senza l'html avrebbe le stesse potenzialità di un web con l'ipertesto?
Qui stiamo applicando il medesimo concetto a livello dei dati.
Il grado del loro riuso.

Non per niente su questo tema farò l'intervento il 20 novembre a Senigallia, un tema sul quale serve riflettere di più.
Anche questo link che avevo portato al VeneziaCamp merita:

> http://blogs.worldbank.org/dmblog/open-vs-public-data-the-big-difference

""The major difference between open and public data is [that with open data] you have the ability to re-use it.  Data in document format is effectively useless.  By making [data] open...people can analyze, compare, and benchmark it, and find patterns that you did not realize.""

La domanda è: è utile aggregare anche tali dati pubblici ma non aperti per creare domanda sui dati aperti?
E' utile inserirli per stimolarne l'estrazione in formato open e riutilizzabile?

E ovviamente, questo vale anche per le licenze.
 Matt

Marco Scaloni

unread,
Nov 5, 2010, 4:49:11 PM11/5/10
to spaghett...@googlegroups.com
2010/11/5 Matteo Brunati <ma...@blog.dagoneye.it>
La domanda è: è utile aggregare anche tali dati pubblici ma non aperti per creare domanda sui dati aperti?
E' utile inserirli per stimolarne l'estrazione in formato open e riutilizzabile?

Io credo di si perché:
- si fa vedere, concretamente, la differenza tra dato pubblico e dato open, e questo serve, come dici tu, a stimolarne l'estrazione
- hai visto mai che qualcuno ("without permission") si prende la briga di estrapolare dal PDF i dati (magari rilasciando il parser come open source) e renderli davvero open (OpenPolis e/o OpenParlamento fanno già così, confermi Guglielmo?)

ciao
m

2010/11/5 Matteo Brunati <ma...@blog.dagoneye.it>

Alberto

unread,
Nov 6, 2010, 1:30:59 PM11/6/10
to Spaghetti Open Data
> *La domanda è: è utile aggregare anche tali dati pubblici ma non aperti per
> creare domanda sui dati aperti?
> E' utile inserirli per stimolarne l'estrazione in formato open e
> riutilizzabile?*

Capisco la vostra argomentazione, ma io credo invece che possa essere
controproducente. SOD serve anche per dare visibilità alle
amministrazioni che rilasciano in formato aperto, distinguendo il
proverbiale grano dal loglio. Se passa l'idea che "in fondo i dati in
PDF possono anche andare bene" è finita. Allora togliamo la parola
open dal nome del sito. Come diceva Nanni Moretti, le parole sono
importanti.

Matteo Brunati

unread,
Nov 8, 2010, 3:50:11 AM11/8/10
to spaghett...@googlegroups.com

>> *La domanda �: � utile aggregare anche tali dati pubblici ma non aperti

>> per
>> creare domanda sui dati aperti?
>> E' utile inserirli per stimolarne l'estrazione in formato open e
>> riutilizzabile?*
>
> Capisco la vostra argomentazione, ma io credo invece che possa essere
> controproducente. SOD serve anche per dare visibilit� alle

> amministrazioni che rilasciano in formato aperto, distinguendo il
> proverbiale grano dal loglio. Se passa l'idea che "in fondo i dati in
> PDF possono anche andare bene" � finita. Allora togliamo la parola

> open dal nome del sito. Come diceva Nanni Moretti, le parole sono
> importanti.
>

Riporto una porzione del commento di Titti (
http://www.titticimmino.com/2010/11/05/opendata-opengov-e-spaghetti-allitaliana-part-1/
) che � in topic:
"Sono d�accordo con Matteo e con quanti ritengono che mostrare i dati che
sono rilasciati PUBBLICI e non open debbano avere visibilit�, ma per
favore non mettiamoli nel � �.�opendata: non facciamo commistione."

In effetti a questo punto forse � il caso di creare una sezione, magari
tramite un blog e una pagina "Dati pubblici" e rinominare l'attuale "Dati"
con "Open Data" ( e qui chi si era offerto di dare una mano magari pu�
tornarci utile ) per mostrare questa differenza abilitando una discussione
mirata.

Qui in realt� se volevamo partire direttamente facendo solo Open Data
puri, che � quello che ha provato a dire Titti quando � entrata in lista,
solo il Piemonte e Linked Open Camera potevamo inserire di fatto. Per non
parlare del fatto che senza una licenza chiara che abiliti il riuso non li
riterrei open data per ovvi motivi impliciti.
Per cui il dilemma implicito era, come era emerso: bisogna sia mostrare i
dati sia crearne domanda.

In una tale situazione il compromesso storico credo sia stata l'unica via
possibile per non piantarsi ed infatti � quella che ho sempre interpretato
implicitamente nel proseguire naturale delle discussioni.

Non a caso spaghetti � un termine usato in programmazione ( spaghetti code
) per indicare il caos di codice senza un design chiaro a monte. Uno
spaghetti code... Questa � la situazione italiana non solo sugli open
data, ma credo attorno ad una grossa fetta della cultura digitale.

Quindi io ho sempre visto il passaggio di spaghetti open data un utile ma
coerente step intermedio di incoerenza tecnica per far emergere il caos
italico, se mi volete accettare la licenza poetica dell'interpretazione.

E questo credo riconosca anche il livello di incomprensioni presente qui
in lista, a vario titolo ed in vari momenti. Ma io la vedo positivamente,
perch� possiamo imparare assai gli uni dagli altri, dalle competenze di
uno rispetto ad un altro.

E la cosa migliore per farlo � rendendo pubblica tale dialettica e tale
trasformazione in corso d'opera. Non siamo un popolo di creativi ed
eccentrici d'altronde? .)

Per chiudere, questa la proposta al momento a questo punto:
- associare un blog a spaghetti open data per valorizzare in maniera
semplice questo percorso in atto, e spiegarne gli step per insegnare dal
nostro confronto cosa sta emergendo per capire dall'interno cosa sono gli
open data e non solo da una definizione, che a questo punto � il caso da
fare per bene

- creare due voci dai dati attuali:
1. Dati pubblici
2. Dati aperti ( o Open Data )


Senza contare che nella fase di raccolta sono stati segnalati anche
servizi Web puri ( tipo il discorso delle elezioni e dei relativi archivi
), che � il modo tradizionale di far navigare i dati senza perderne il
controllo.
E la forma pi� comune di pensare ai dati via Web.
Siano essi fruibili in PDF o tramite tabelle HTML poco importa. Non � il
concetto degli Open Data.
A questo punto � utile farli emergere, anzi fondamentale tali differenze.

Ovviamente il tutto fa parte di un'interpretazione delle dinamiche e delle
parole usate fino ad oggi totalmente a mia discrezione, e potrei
sbagliarmi of course.
La cosa importante � che dalle differenze possiamo creare valore stavolta.
Cosa ne dite di questo sunto?

Ovviamente il tutto in un percorso anche tecnico per normalizzare la
situazione e passare a CKAN con i crismi del caso, come diciamo da tempo e
forse adesso ne abbiamo maggiormente capito il valore, anche di struttura
e di coerenza di stile.
Questa almeno � la differenza attuale anche di sostanza tra it.ckna.net e
spaghettiopendata.org, a mio avviso non certo inutile.
Valorizziamo tale percorso?

Matt

Alberto

unread,
Nov 8, 2010, 6:27:22 AM11/8/10
to Spaghetti Open Data
Matteo, credo che abbiamo capito tutti che l'apertura dei dati è una
variabile continua e non discreta. Per quanto mi riguarda, se ci posso
pasticciare senza reimmetterli a mano, mi va ancora bene. Per esempio,
DPSeXplorer ha solo un'interfaccia web, ma io la posso interrogare,
farci grafici di vario tipo, dopodiche se trovo una roba sensata
faccio uno screengrab e lo sbatto sul blog. Non è certo il massimo, ma
c'è un grado di apertura. Con i dati in PDF non ci posso fare niente.
Quindi io propongo di abbassare l'asticella per escludere le basi dati
disponibili solo in PDF. Poi, ovviamente, mi rimetto alla saggezza del
gruppo. :-)

Quanto al blog, sarebbe bellissimo, ma io dico fin d'ora che non ho
tempo di scriverci. Probabilmente aggiungerei – questo sì – una FAQ
che spiega le cose che hai scritto tu, magari in modo un po' più
sintetico.

Pennisi Aline

unread,
Nov 8, 2010, 6:36:29 AM11/8/10
to spaghett...@googlegroups.com
Matteo, io sono d'accordo con Alberto -i file PDF andrebbero esclusi, è proprio come avere un pezzo di carta e niente più.
Tra gli altri dati (PDF esclusi) potrebbe però essere utile la tua idea di creare un distinguo tra i dati veramente open secondo tutti i crismi e quelli disponibili /riutilizzabili ma senza tutti i crismi. Potrebbe servire anche a far vedere che con una certa facilità e sforzi limitati molti dati del secondo gruppo possono diventare veramente open.
Senza fare due liste separate, si potrebbe inserire una "stellina" ai DB considerati davvero open - un po' per spingere gli altri a migliorare...

-----Messaggio originale-----
Da: spaghett...@googlegroups.com [mailto:spaghett...@googlegroups.com] Per conto di Alberto
Inviato: lunedì 8 novembre 2010 12.27
A: Spaghetti Open Data
Oggetto: Re: Friendly fire dagli amici stranieri, ma anche una critica (giusta)

Matteo, credo che abbiamo capito tutti che l'apertura dei dati è una
variabile continua e non discreta. Per quanto mi riguarda, se ci posso
pasticciare senza reimmetterli a mano, mi va ancora bene. Per esempio,
DPSeXplorer ha solo un'interfaccia web, ma io la posso interrogare,
farci grafici di vario tipo, dopodiche se trovo una roba sensata
faccio uno screengrab e lo sbatto sul blog. Non è certo il massimo, ma
c'è un grado di apertura. Con i dati in PDF non ci posso fare niente.
Quindi io propongo di abbassare l'asticella per escludere le basi dati
disponibili solo in PDF. Poi, ovviamente, mi rimetto alla saggezza del
gruppo. :-)

Quanto al blog, sarebbe bellissimo, ma io dico fin d'ora che non ho

tempo di scriverci. Probabilmente aggiungerei - questo sì - una FAQ

Alberto Cottica

unread,
Nov 8, 2010, 6:40:35 AM11/8/10
to spaghett...@googlegroups.com
Buona l'idea della stellina! È il tipo di rinforzo positivo che mi piace usare nelle mie cose.


Irene Celino

unread,
Nov 8, 2010, 6:50:11 AM11/8/10
to spaghett...@googlegroups.com
Anche io sono d'accordo con la stellina.

Anzi, se vogliamo andare nella direzione dei linked open data (e non semplicemente degli open data), potremmo riutilizzare le stelline di tim Berners-Lee:
http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
Ovvero, una scala da 1 a 5 stelle per indicare *quanto* aperto (e linkato) è uno specifico dataset.

HTH,
Irene


Il giorno 08 novembre 2010 12:40, Alberto Cottica <alb...@cottica.net> ha scritto:
Buona l'idea della stellina! È il tipo di rinforzo positivo che mi piace usare nelle mie cose.



--

    " If you understand what you're doing,
           you're not learning anything. "

Matteo Brunati

unread,
Nov 8, 2010, 8:38:52 AM11/8/10
to spaghett...@googlegroups.com

> Anche io sono d'accordo con la stellina.
>
> Anzi, se vogliamo andare nella direzione dei linked open data (e non
> semplicemente degli open data), potremmo riutilizzare le stelline di tim
> Berners-Lee:
> http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
> Ovvero, una scala da 1 a 5 stelle per indicare *quanto* aperto (e linkato)
> è
> uno specifico dataset.
>
> HTH,
> Irene

Ottimo Irene, grazie .)
Avevo dimenticato queste stelline, davvero mitiche: allora provo con le
stelline.
Domani sera le inserisco e mettiamo una legenda relativa e vediamo come
viene.

Matt

Dario Solari

unread,
Nov 8, 2010, 9:48:58 AM11/8/10
to Spaghetti Open Data
Scusate se intervengo. Condivido la vostra idea di differenziare gli
opendata dai dati pubblici.
E' giusto mettere in evidenza quali sono le amministrazioni che
rilasciano opendata e quali non lo fanno (con tutte le tonalità di
grigio che ci possono essere tra queste due posizioni antitetiche).
Va però differenziata la disponibilità dell'informazione dall'operato
dell'istituzione/ente che la produce. Un conto è mettere in evidenza
quali istituzioni offrono opendata (un riconoscimento al loro buon
lavoro), un altro è offrire l'informazione ai cittadini (obiettivo che
personalmente ritengo più rilevante). In questo senso anche un pdf è
utile, se si offre lo script di parsing delle informazioni che
contiene.

Io penso che il più grosso problema sia l'accessibilità delle
informazioni.
Già poter disporre di un servizio che permetta di conoscere quali sono
i dati pubblici disponibili (non solo opendata) è molto.

Dario
Reply all
Reply to author
Forward
0 new messages