Dati.gov.it - elenco data set pubblicati

130 views
Skip to first unread message

Gianluca Piras

unread,
Feb 20, 2013, 8:33:48 AM2/20/13
to spaghett...@googlegroups.com
Ciao a tutti,

sbaglio io o non c'è possibilità di ottenere dal portale italiano un elenco dei dataset pubblicati con relativi attributi (ne file ne api) ?

Un obiettivo per il prossimo hackathon potrebbe essere quello di dargli una mano ad essere un po' più open ;-)


Luca

unread,
Feb 20, 2013, 8:41:47 AM2/20/13
to spaghett...@googlegroups.com, spaghett...@googlegroups.com
sai invece cosa si potrebbe fare?
aiutarli a interfacciare ckan con drupal per ottenere quello che dici... qualcuno che ha competenze su ckan?
aggiungerci pure una componente geografica tipo un geonode...



luca corsato
fb luca.corsato
tw lucacorsato
--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più i suoi messaggi, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata?hl=it.
Per ulteriori opzioni, visita https://groups.google.com/groups/opt_out.
 
 

Paolo Mainardi

unread,
Feb 20, 2013, 8:43:07 AM2/20/13
to spaghett...@googlegroups.com
Infatti, sono d'accordissimo con Luca, questo sarebbe un colpaccio :)

2013/2/20 Luca <luc...@gmail.com>



--
TWINBIT logo 

Paolo Mainardi 
Twinbit Founder - CTO

www:      twinbit.it 
mobile:   (+39) 3401678089 
skype:    paolo_mainardi 
linkedinpaolomainardi 
twitter:  @paolomainardi 
blog:     paolomainardi.com 

Alessio 'Blaster' Biancalana

unread,
Feb 20, 2013, 8:58:37 AM2/20/13
to spaghett...@googlegroups.com

'O vedi? Uno si distrae un attimo e subito emerge una cosa fichissima :D

Ale
Inviato da Android

Gianluca Piras

unread,
Feb 20, 2013, 9:09:12 AM2/20/13
to spaghett...@googlegroups.com, pa...@twinbit.it
Ok, quindi la mia richiesta non era così naive :-)

Dal punto di vista tecnico specifico non ho sufficienti competenze ... comunque supporto ben volentieri la causa se ci fosse l'occasione.

Credo che si tratti di un'altra possibile occasione nella quale far vedere che c'è una comunità in grado di mobilitarsi per fornire un "servizio" 

Grazie  

Luca

unread,
Feb 20, 2013, 9:18:58 AM2/20/13
to spaghett...@googlegroups.com, spaghett...@googlegroups.com, pa...@twinbit.it
Gianluca, sei nel posto giusto! se una proposta sembra impossibile, qui si lavora per provarci. sempre.


luca corsato
fb luca.corsato
tw lucacorsato

Alessio 'Blaster' Biancalana

unread,
Feb 20, 2013, 9:25:47 AM2/20/13
to spaghett...@googlegroups.com, Paolo Mainardi

E vantiamo anche casi non indifferenti di riuscita :D

Ale
Inviato da Android

Maurizio Napolitano

unread,
Feb 20, 2013, 11:06:47 AM2/20/13
to spaghett...@googlegroups.com
2013/2/20 Luca <luc...@gmail.com>:
> sai invece cosa si potrebbe fare?
> aiutarli a interfacciare ckan con drupal per ottenere quello che dici...

Posso dirti con estrema certezza che in dati.gov.it si parla di questo.

> qualcuno che ha competenze su ckan?

indovina chi :)
cmq fa presente che a livello nazionale serve anche una tassonomia
condivisa e almeno un layer minimo di interoperabilita' per implementare
le funzioni di harvesting dai vari data portal che non sono tutti ckan
compatibili

> aggiungerci pure una componente geografica tipo un geonode...

Su questa ho i miei dubbi sul fronte della missione di dati.gov.it

Alberto

unread,
Feb 20, 2013, 11:48:30 PM2/20/13
to spaghett...@googlegroups.com
@Napo, quindi se ho ben capito consigli di lasciare perdere? C'è già chi ci pensa?

Maurizio Napolitano

unread,
Feb 21, 2013, 2:03:14 AM2/21/13
to spaghett...@googlegroups.com

@alberto NI
Sicuramente sviluppare un plugin drupal diventa una cosa dì interesse Per ora gli sviluppi migliori che ho visto sono integrazioni con wordpress mentre su drupal ho visto usare lo stesso template
Penso che da fare dì interessante ci sarebbero degli harvester che pescano i metadati dai vari portali italiani e li rimappano nelle categorie di dati.gov.it per poi pubblicarli
Alcuni portali offrono il dataset dei dataset (firenze, bologna, veneto) ognuno in maniera diversa (cvs separato da virgola o punto e virgola o rss) altri esportano api (toscana, milano, roma provincia roma, bari, piemonte) che sono ckan o ckan style altri nulla o api da scovare (tipo csw o caso istat).
Uno dei veri problemi è che ckan va come un treno (nello sviluppo) e fra una release e l'altra si trovano malfunzionamenti
Solo alitando sul collo degli sviluppatori che mantengono le piattaforme di maggior successo (=UK) si scopre bene quali patch usare, altrimenti è un delirio
Spero che con l'ingresso di data.gov arrivi un pastore a cavallo in grado di gestire questa mandria inferocita e caotica che è lo sviluppo a bazar di una piattaforma os come ckan

In ogni caso sono ben disposto a scrivere due righe di cosucce da fare

Ciao

--

Daniele Crespi

unread,
Feb 21, 2013, 2:12:52 AM2/21/13
to spaghett...@googlegroups.com

anche Regione Lombardia da ieri pubblica un dataset dei dataset, scaricabile o accedibile tramite API

nel tempo lo arricchiremo con maggiori info

ciao
daniele

Maurizio Napolitano

unread,
Feb 21, 2013, 2:15:05 AM2/21/13
to spaghett...@googlegroups.com

Ops
Scusami Daniele se non vi avevo messi in elenco :-[
Ho scordato anche la RER

Daniele Crespi

unread,
Feb 21, 2013, 2:17:15 AM2/21/13
to spaghett...@googlegroups.com

anche Regione Lombardia da ieri pubblica un dataset dei dataset, scaricabile o accedibile tramite API

nel tempo lo completeremo

ciao
daniele

Il giorno 21/feb/2013 08:03, "Maurizio Napolitano" <napo...@gmail.com> ha scritto:

Gianluca Piras

unread,
Feb 21, 2013, 4:46:47 AM2/21/13
to spaghett...@googlegroups.com
Naturalmente c'è già chi ha affrontato il problema e scritto del codice su Github.

Al di là del tema tecnico credo che sia altrettanto importante quello della volontà "politica" degli amministratori di Dati.gov.it ... e su questo onestamente passo ai membri più esperti del gruppo per tracciare la strada :-)

Anche se comunque faccio notare che si tratta di una direzione tecnologica che sta intraprendendo anche il portale open data americano (link) ... si può quasi considerare uno standard.

Maurizio Napolitano

unread,
Feb 21, 2013, 4:57:45 AM2/21/13
to spaghett...@googlegroups.com
2013/2/21 Gianluca Piras <ilgp...@gmail.com>:
> Naturalmente c'è già chi ha affrontato il problema e scritto del codice su
> Github.

Si si, ma la cosa e' leggermente diversa.
Un modulo e' stato fatto anche da data.gov.uk
Guarda qui
https://docs.google.com/document/d/1rMRxuwVh7rK-dDRZukspC4y2HlXynF4RGS0mj4OjhVo/edit

>
> Al di là del tema tecnico credo che sia altrettanto importante quello della
> volontà "politica" degli amministratori di Dati.gov.it ... e su questo
> onestamente passo ai membri più esperti del gruppo per tracciare la strada
> :-)
>
> Anche se comunque faccio notare che si tratta di una direzione tecnologica
> che sta intraprendendo anche il portale open data americano (link) ... si
> può quasi considerare uno standard.

Yes!
I know, sono coinvolto su alcune cose
http://www.slideshare.net/napo/ckan-the-open-source-data-portal-platform
Maurizio "Napo" Napolitano
http://de.straba.us

Diego Valerio Camarda

unread,
Feb 21, 2013, 5:00:16 AM2/21/13
to spaghett...@googlegroups.com
ma non pensate che il giro

portali locali <-- harvest ckan dati.gov.it --> esposizione di api/lod 

si potrebbe sostituire con 

portali locali <-- harvest che produce e pubblica LOD <-- ingestion in ckan dati.gov e altri riusi direttamento su LOD pubblicati con arricchimento (es. link a SPCDATA per i produttori)

questo potrebbe spingere con il tempo l'approccio definitivo

portali locali --> espongono LOD <-- LOD cloud dati italiani con arricchimenti vari <-- ckan dati gov e altri soggetti


questo nell'ottica che oggi c'è ckan, domani ce ne potrebbe essere un altro e via dicendo

non so se sono stato abbastanza chiaro :)


----------
Diego Valerio Camarda
dcam...@regesta.com - www.regesta.com

Sabrina Onano

unread,
Feb 21, 2013, 11:25:40 AM2/21/13
to spaghett...@googlegroups.com
Ciao,
io mi occupo della parte tecnica di dati.gov.it e vi aggiorno su cosa stiamo facendo e su cosa abbiamo in progetto di fare.

Come accennato da Napo abbiamo già affrontato il problema di interfacciare l’installazione Drupal di dati.gov.it con ckan e in questo proprio Napo ci stava aiutando.
 
Il lavoro, iniziato nel luglio scorso ha subito una battuta d’arresto sia per problemi tecnici legati al fatto che anche le fonti dati che erano dichiaratamente ckan compatibili presentavano problemi nell’harvesting (questo succedeva a luglio, quindi oggi la situazione potrebbe essere diversa) sia per il fatto che dati.gov.it è da allora che non ha finanziamenti diretti quindi abbiamo dovuto rallentare sui nuovi sviluppi concentrando le poche risorse disponibili nell’ordinaria manutenzione.
 
Detto questo un contributo allo sviluppo sarebbe senz’altro gradito.
 
Visto il variegato panorama dei repository di dati aperti nelle amministrazioni italiane, la soluzione cui avevamo pensato era quella di utilizzare ckan per l’harvesting dei dati, non esporlo all’esterno, e utilizzare Drupal per la visualizzazione.
 
Oltre i problemi di tipo tecnico, il problema maggiore è quello che i vari repository utilizzano schemi di classificazione dei dataset diversi e come ha già detto Napo sarebbe necessario un set minimo di metadati condiviso.
 
Se riuscissimo a fare l’harvesting dei dati dagli 11 repository che da soli coprono l’80% degli open data italiani, sarebbe un grande risultato.
Ovviamente a quel punto anche dati.gov.it potrebbe mettere a disposizione il dataset di tutti i dataset in formato aperto.

ciao
Sabrina

Sabrina Onano
FormezPA Centro Formazione Studi 
Progetti speciali e Politiche Straordinarie di Governo
Via Roma, 83 
09124 CAGLIARI
tel. 0039 070 67956233
Skype ID: sabr_on 

Alfredo Serafini

unread,
Feb 21, 2013, 6:02:52 PM2/21/13
to spaghett...@googlegroups.com
non mi è chiaro se dietro alla parte front in drupal l'harvesting avvenga o meno con tecnologie diverse dal php?
esiste il codice degli harvester in opensource? se c'è magari possiamo ragionare qui in lista su chi può/vuole contribuire e darvi un contributo. Si può contribuire in caso? :-)

Per la parte LOD: personalmente credo che non sarebbe male definire le tassonomie in RDF, così da favorire le varie integrazioni, è anche vero che se poi da ckan stesso non si escogitano sistemi oggettivi per accedere alla parte linked, passare ai LOD è del tutto pretestuoso. Se si decide che ckan è il datahub di riferimento per censire i vari dataset (cosa che non ho ancora capito -chiedo venia- se sia davvero, standard de facto o ufficiale che sia), credo sarebbe opportuno che sulle parti specifiche con RDF (ma si può benissimo fare per tutto) pubblicasse direttamente cose come delle "mappe" in void, così da offrire dei criteri oggettivi per le interrogazioni. Se magari esistono già chiedo di nuovo venia, ma finora non ci ho mai fatto caso :-)

Maurizio Napolitano

unread,
Feb 22, 2013, 10:26:19 AM2/22/13
to spaghett...@googlegroups.com
> Il lavoro, iniziato nel luglio scorso ha subito una battuta d’arresto sia
> per problemi tecnici legati al fatto che anche le fonti dati che erano
> dichiaratamente ckan compatibili presentavano problemi nell’harvesting
> (questo succedeva a luglio, quindi oggi la situazione potrebbe essere
> diversa) sia per il fatto che dati.gov.it è da allora che non ha
> finanziamenti diretti quindi abbiamo dovuto rallentare sui nuovi sviluppi
> concentrando le poche risorse disponibili nell’ordinaria manutenzione.
>
> Detto questo un contributo allo sviluppo sarebbe senz’altro gradito.

Grande :)
Infatti su questo la proposta che porto in questa ML e' la seguente:
- guardiamo i vari portali OGD italiani (dati.gov.it mostra solo quelli ogd),
- stimoliamo perche' sia presente il dataset dei dataset o vediamo di
produrre script che li generano
- cerchiamo di fare un mapping fra la tassonomia di dati.gov.it e quella
del relativo portale ogd di turno
- andiamo a popolare (come test) it.ckan.net attraverso le apposite API
- pubblichiamo i sorgenti di questi script
(perche' poi dovrebbero venire reingegnerizzati per essere utilizzati come
harvesting di ckan - https://github.com/okfn/ckanext-harvest )

da qui poi penso che si sarebbe un gran bel contributo per quello
che riguarda i discorsi che in tanti fanno su lod, semantica condivida
ecc...

Alfredo Serafini

unread,
Mar 10, 2013, 10:25:57 PM3/10/13
to spaghett...@googlegroups.com
ciao leggo solo ora causa periodo un po' faticoso
@napo: ma quindi suggerisci di attivarci in maniera operativa per contribuire con degli script dedicati? potremmo condividerli sul solito github di SOD...
Reply all
Reply to author
Forward
0 new messages