Sul suo spazio vimeo http://vimeo.com/user586242
ci sono due video che spiegano il progetto
http://vimeo.com/19774669
http://vimeo.com/20279333
Arrivo al dunque:
buzzdata vuole essere una sorta di github dei dati, e finalmente sono
usciti dalla beta.
Vi giro un blog post in inglese di una entusiasta data journalist
http://governingpeople.com/davideaves/23571/open-source-data-journalism-happening-now-buzz-data
Si, conoscevo la beta di buzzdata. Alcune cose mi convincono, altre meno. Ve ne volevo già parlare ma lo faccio appena trovo una tastiera vera. Sono fuori italia (al freddo, brrrr) con lo smartphone. Vinc
In generale sono contrario che la p.a. appoggi i dati su piattaforme di privati
e proprietarie.
Rimango dell'idea però che, una volta che i dati sono pubblici e con licenze
aperte, poi ognuno fa quello che vuole.
Preferisco l'approccio ckan in quanto fa riferimenti alle datasource.
In ogni caso se sono utenti a inserire i dati, con licenze aperte, e con una
componente social, la cosa non è male. no?
Trovata la tastiera “vera”!
Eravamo partiti da Buzzdata. Non è che l’ultima di svariate
piattaforme per la condivisione di dati. In questo caso viene “enfatizzato”
l’aspetto Social (la piattaforma consente ad esempio di definire un profilo,
di seguire altri profili , di avere un
network di relazioni di riferimento) che consente la propagazione dei dati (da
qui il nome “Buzz”).
Sono molto d’accordo con Napo quando ritiene che la PA
dovrebbe mettere a disposizione i dati come le è più comodo sul proprio sito
Web. Al momento credo sia la cosa migliore per consentire senza troppi problemi un facile e rapido
rilascio di dati.
D’altronde Alberto solleva un problema reale che a mio
avviso è una questione chiave: la necessità di avere una piattaforma di
riferimento per la condivisione di dati. (o meglio, di dataset). Ovviamente questa
piattaforma non può essere Google Docs per tutta una serie di ragioni che
conosciamo, ma non può essere neanche nessuna delle piattaforme di “data
market” al momento disponibili tipo Socrata, Factual e varie altre, BuzzData
compreso. E questo a prescindere da dove sono localizzati il loro data center,
cosa che come abbiamo visto comporta
altri tipi di problemi. (Una piattaforma
del genere è ovviamente qualcosa di molto diverso dai “cataloghi” attualmente
utilizzati sulle piattaforme di datagov, ckan compreso).
Nessuna piattaforma di condivisione dati al momento ha infatti una gestione “strutturata” di quelli che vengono chiamati “metadati”. Questo a mio avviso è un problema chiave la cui risoluzione consentirebbe di “iniettare” dati in rete e soprattutto di ritrovarli attraverso Apps e non a manella come invece generalmente accade ora. (Mettere dati sulla Rete come si sta facendo ora aumenta il “Data Deluge” e i cataloghi di dati aiutano ma non risolvono questo problema). Il “problema” metadati è sempre stato un argomento alquanto complesso e spinoso, ma credo di averci riflettuto abbastanza nell’ultimo periodo e di avere ora una visione molto precisa per una gestione “easy” della cosa. Mi rendo conto che non è un argomento da approfondire in mailing list nel giorno di Ferragosto. Ad ogni modo sto scrivendo alcune cose su questa questione che sarò felice di condividere con voi e con chi lo vorrà.
Un saluto e buon ferragosto. O almeno quello che resta :-)
Vinc
grande :)
> Eravamo partiti da Buzzdata.
quando l'ho visto pensavo proprio ai discorsi che avevo sentito a webvalley :)
> Non è che l’ultima di svariate piattaforme per
> la condivisione di dati. In questo caso viene “enfatizzato” l’aspetto Social
> (la piattaforma consente ad esempio di definire un profilo, di seguire
> altri profili , di avere un network di relazioni di riferimento) che
> consente la propagazione dei dati (da qui il nome “Buzz”).
Si ha questo aspetto social che dovrebbe innescare un po' di cosucce
carine
Un esempio pratico e' in questo blog post
http://eaves.ca/2011/08/03/open-source-data-journalism-%E2%80%93-happening-now-at-buzz-data/
dove una persona ha elaborato dei dati e date le sue considerazioni
un altro ha detto "bello!" ed ha aggiunto dei dati per migliorare
le ipotesi e avanti di questo passo
Insomma un qualcosa che avvicina le persone ai dati
> Sono molto d’accordo con Napo quando ritiene che la PA dovrebbe mettere a
> disposizione i dati come le è più comodo sul proprio sito Web. Al momento
> credo sia la cosa migliore per consentire senza troppi problemi un facile e
> rapido rilascio di dati.
Inutile dire che ne sono fermamente convinto, cosi' come lo sono
dell'idea che poi
ci sia il richiamo in ckan.net
Di questo lo pensa anche l'unione europea per il portale europeo open data
http://ec.europa.eu/information_society/policy/psi/docs/pdfs/call_tenders/tender_specifications_final.pdf
dove viene chiesto un portale LAMP su Drupal e CKAN con
interrogazione SPARQL e implementazioni di librerie con open source
per java, python e ruby.
tra l'altro, sulle API di CKAN, ho proposto uno stage ad uno studente
per integrarle con
SOFA - http://www.sofastatistics.com
Su suggerimento anche di alcune persone di OKFN.
> [...]
> Nessuna piattaforma di condivisione dati al momento ha infatti una gestione
> “strutturata” di quelli che vengono chiamati “metadati”. Questo a mio avviso
> è un problema chiave la cui risoluzione consentirebbe di “iniettare” dati in
> rete e soprattutto di ritrovarli attraverso Apps e non a manella come invece
> generalmente accade ora. (Mettere dati sulla Rete come si sta facendo ora
> aumenta il “Data Deluge” e i cataloghi di dati aiutano ma non risolvono
> questo problema). Il “problema” metadati è sempre stato un argomento
> alquanto complesso e spinoso, ma credo di averci riflettuto abbastanza
> nell’ultimo periodo e di avere ora una visione molto precisa per una
> gestione “easy” della cosa. Mi rendo conto che non è un argomento da
> approfondire in mailing list nel giorno di Ferragosto. Ad ogni modo sto
> scrivendo alcune cose su questa questione che sarò felice di condividere con
> voi e con chi lo vorrà.
Ora sono poco fuori dagli aspetti tecnici di CKAN, ma una parte rdf e' gia'
presente, immagino che il passaggio a qualcosa di piu' concreto sia molto
vicino.
OKFN e' anche impegnata nel progetto europeo LOD2
http://lod2.eu/Welcome.html
... dove tra l'altro partecipa anche un mio collega con il motore di ricerca
Sig.ma
Qui un esempio con uno dei personaggi di questa ml :)
http://sig.ma/search?q=Alberto+Cottica
In ogni caso, sull'aspetto linked e sui limiti di ckan mi aspetto una
risposta molto piu' esaustiva da parte di Matteo Brunati e/o Michele
Barbera (o altre persone di questa ml che non conosco ma sono
molto piu' competenti di me)
Grandi!!!
> al momento la ospitiamo noi, poi andrà messa in un datacenter.
> Per quelli di voi interessati c'é disponibile una alfa che contiene jn
> subset di dati provenienti da progetti reali di e-gov.
fichissimo!
partecipate alla chiamata europea?
http://ec.europa.eu/information_society/policy/psi/docs/pdfs/call_tenders/tender_specifications_final.pdf
> Chi ne volesse sapere di più me lo faccia sapere.
> Paolo
Eccomi :)
come gia' detto a suo tempo reputo sia importante che la p.a. non
si abitui poi a questi strumenti per gestire altro.
Google ci impiega poco a creare anche la gestione dei metadati.
Di suo ci ha gia provato in altre occasioni:
vedi http://www.google.com/health/
Mi rendo però conto che per molti piccoli comuni l'appoggiarsi
a questi servizi che sono gratuiti, efficienti e diffusi è una ghiotta
occasione invece che stare al "giogo" di altri.
Ps:
credo di averlo già segnalato, ma un intervento che mi ha affascinato
sul tema della gestione dei dati in mano ad aziende private è nell'
intervento di Moglen al FOSDEM2011
http://de.straba.us/2011/03/28/eben_moglen_al_fodem_2011/
Concordo sulla tua osservazione.
Comunque, rimango dell'idea che fino a che si fa un uso consapevole
va benissimo, quando però (e la tentazione è forte) si usa una piattaforma
privata - anche se ad uso gratuito - come strumento di lavoro allora le
cose cambiano.
Gli open data devono comunque garantire privacy, segreto statistico,
segreto militare, flora e fauna protetta ecc...
Per creare queste garanzie devi avere tutti i dati che devono essere
tutelati che gli ha raccolti.
Se il punto di archiviazione diventa quello (a prescindere dall'azienda)
qualche dubbio mi viene.
Ripeto che è un caso estremo, ma sono convinto che la tentazione
sia sempre alta.
ciao