Concorso su big data di Telecom

115 views
Skip to first unread message

Maurizio Napolitano

unread,
Dec 6, 2013, 3:22:29 AM12/6/13
to Spaghetti Open Data
vi segnalo questo concorso di Telecom
http://www.telecomitalia.com/tit/en/bigdatachallenge.html
in cui sono coinvolti SpazioDati, EIT ICT Labs Italy, TrentoRISE,
Unitn e FBK, Politecnico di Milano e MIT Media Lab

In sintesi:
saranno messi a disposizione (e non come open data)
alcuni dataset "sexy" sull'area di Milano e la Provincia di Trento
che coprono un arco temporale di due mesi (da novembre a
dicembre 2013) da cui fare analisi per ricerca scientifica,
visualizzazione e applicazioni

Un esempio di dataset:
traffico di telefonia mobile, dati e voce su Milano e Provincia
di Trento, opportunamente anonimizzato e aggregato.

Non si tratta di open data, ma gli open data saranno fondamentali
per fare la differenza.
Personalmente credo che il successo di questa iniziativa sia di
interesse per portare avanti la causa open data.



--
Maurizio "Napo" Napolitano
http://de.straba.us

Alessio 'Blaster' Biancalana

unread,
Dec 6, 2013, 3:45:28 AM12/6/13
to spaghett...@googlegroups.com

Napo, sono curioso: come porteresti avanti il tema dell'open data in questo ambito? Coniugando l'app che scrivi con altri dati in formato open?

Ale
Inviato da Android

--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più i suoi messaggi, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.
Per ulteriori opzioni, visita https://groups.google.com/groups/opt_out.

Nicola Rossi

unread,
Dec 6, 2013, 3:53:23 AM12/6/13
to spaghett...@googlegroups.com
2013/12/6 Maurizio Napolitano <napo...@gmail.com>:
Scusate ma se tali dati non sono open, come può essere utile alla
causa OpenData ?
Al massimo tale contest può dimostrare che il riuso dei dati può
estrarre ancora valore da essi e quindi non farebbe altro che renderli
ancora più closed.

Non voglio sembrare polemico e spero che mi corregerete.

Grazie,
Nicola

Maurizio Napolitano

unread,
Dec 6, 2013, 4:08:25 AM12/6/13
to Spaghetti Open Data
2013/12/6 Alessio 'Blaster' Biancalana <dottor...@gmail.com>:
> Napo, sono curioso: come porteresti avanti il tema dell'open data in questo
> ambito? Coniugando l'app che scrivi con altri dati in formato open?

rispondo ad Alessio per rispondere anche a Nicola
Dimostrando che chiunque può creare analisi, visualizzazioni e applicazioni
dall'incrocio di dati, mette in evidenza di avere più dati possibili.
Ci sono dati che possono essere resi aperti, altri no.
Si apre però tutto uno scenario che permette ad aziende che hanno dati
di migliorare la propria posizione.
Ne avevo scritto qualcosa qui
http://www.chefuturo.it/2013/09/per-innovare-davvero-open-data-deovono-tirare-fuori-lato-sexy/

Una volta che alcuni dati saranno messi a disposizione per quel concorso
e se si otterranno risultati interessanti, credo che sarà facile convincere il
data provider al rilascio in open data.

mi viene in mente il recente caso della Sardegna: i geo dati della Regione
sono distribuiti con una licenza non propriamente open data, vedendo però
quanto stava accadendo hanno dato il permesso dell'import in openstreetmap
(= ergo open data).
Ed ora, da quello che ho inteso, si sta ragionando in ottica di rivedere la
licenza d'uso.

sarò un po' fissato: ma ogni azione di riuso dei dati per me vuol dire esempio
per motivare all'open data.

Alberto

unread,
Dec 6, 2013, 4:32:39 AM12/6/13
to spaghett...@googlegroups.com
Napo, su questo non sono d'accordo. Può essere che nel caso specifico tu abbia ragione, ma in generale non è detto che un lavoro di riuso dei dati incoraggi al rilascio in open. Le aziende più data oriented del pianeta considerano i loro dati un asset strategico e non li mollano neanche se piangi in greco. Non vale neanche la logica dell'incrocio, perché ogni azienda è interessata al fatto che gli altri rilascino i dati in open, il che rende possibile gli incroci con i propri dati; e se tutti si fanno questo calcolo, l'equilibrio di Nash è la chiusura totale. 

Andrea Maurino

unread,
Dec 6, 2013, 4:34:14 AM12/6/13
to spaghett...@googlegroups.com

Concordo con napo. Rilasciare i dati per le aziende è sempre considerato come una perdita (non solo economica, ma più in generale di ownership dei dati).
se si riesce a convincere le aziende che dopo il rilascio,  il valore delle informazioni ottenute dal riuso/integrazione dei propri dati con altri è maggiore del valore percepito come perdita allora saranno ben disposte ad aprire i dati.

Giro la call ai miei studenti.

Andrea

Maurizio Napolitano

unread,
Dec 6, 2013, 4:36:44 AM12/6/13
to Spaghetti Open Data
2013/12/6 Alberto <alberto...@gmail.com>:
> Napo, su questo non sono d'accordo. Può essere che nel caso specifico tu
> abbia ragione, ma in generale non è detto che un lavoro di riuso dei dati
> incoraggi al rilascio in open. Le aziende più data oriented del pianeta
> considerano i loro dati un asset strategico e non li mollano neanche se
> piangi in greco. Non vale neanche la logica dell'incrocio, perché ogni
> azienda è interessata al fatto che gli altri rilascino i dati in open, il
> che rende possibile gli incroci con i propri dati; e se tutti si fanno
> questo calcolo, l'equilibrio di Nash è la chiusura totale.

Capisco il tuo punto di vista, so solo che in questo caso c'è stata
una azienda che ha cominciato a pensare che forse quei dati
che metterà lì potrà rilasciarli come open data.
Questo mi fa ben sperare.
Dubito fortemente che Telecom rilascerà dati, anche se, quel
dataset che loro offrono suppongo che fra un anno avrà
interesse solo in ambito accademico.

Andrea Maurino

unread,
Dec 6, 2013, 4:37:53 AM12/6/13
to spaghett...@googlegroups.com

Alberto quello che dici tu è il dilemma del prigioniero della teoria dei giochi. La scelta è condivido/ non condivido ho fatto un lavor anni fa (e lo sto facendo ancora con le organizzazioni agricole della Lombardia) qui c'è un lavoro che ho presentato alla top conference sui sistemi informativi

http://dx.doi.org/10.1007/978-3-642-38709-8_31

--

Alberto

unread,
Dec 6, 2013, 4:55:15 AM12/6/13
to spaghett...@googlegroups.com
Sì, ho studiato un po' di teoria dei giochi :-) 

A giudicare dall'abstract (il paper è dietro un paywall) ti occupi della condivisione all'interno di un gruppo, non con il mondo intero. Normalmente la condivisione open data avviene via API, standard e simili piuttosto che con un data warehouse, no? Cioè, ISTAT ha un data warehouse per la propria roba; e noialtri possiamo attaccarci al bocchettone, perché i dati sono open. Ma se fossero chiusi, loro avrebbero probabilmente un data warehouse comunque, per integrare i dati dei vari pezzi di ISTAT; l'unica differenza sarebbe il bocchettone chiuso o a pagamento. 

Dal punto di vista game-theoretical condividere con il mondo è più difficile che condividere con un gruppo ristretto, perché nel secondo caso puoi negoziare un accordo e monitorarlo. Nel primo il free riding è inevitabile, anzi è il punto di tutta la faccenda.

Andrea Maurino

unread,
Dec 6, 2013, 5:14:58 AM12/6/13
to spaghett...@googlegroups.com
Scusami ero in giro è ho usato il primo link che ho trovato. Qui c'è la presentazione che ho fatto http://www.pros.upv.es/index.php/en/accepted-papers-m/130-speakers/1346-gianluigi-viscusi.  

Una volta che i dati sono stati integrati (usando un'architettura di virtual data integration basata su teeid su cui sopra ci ho messo penthao) i dati sono accessibili a diversi utenti con diversi livelli di qualità (inteso come granularità delle informazione e timeliness) nel progetto era previsto che mensilmente si buttavano fuori (in formato pdf, ma allora non conoscevo gli open data e mi cospargo il capo di cenere)  i prezzi medi mensili di vendita di alcune referenze campione che le organizzazioni di produttori vendono alla GDO

Per farti un esempio durante il progetto era uscito un articolo sulla stampa in cui si diceva che i prezzi medi della spesa erano aumentati del 4%, dai dati mensili pubblicati si vedeva come le organizzazioni dei produttori NON avevano aumentato i prezzi. Idem per i casi di temperature rigide che provocano una immediato aumento dei prezzi al comsumo degli ortaggi anche se il ciclo culturale delle babyleaf (rucola e simili) per esempio è di 18 giorni....questi esempi hanno coinvinto l'associazione a continuare con la sperimentazione e spero entro giugno 2014 di mettere on line la nuova versione con un'interfaccia basata su open data.

ti mando via mail a te (e a chi fosse interessato) in privato  il paper


2013/12/6 Alberto <alberto...@gmail.com>

Matteo Brunati

unread,
Jan 28, 2014, 8:38:23 AM1/28/14
to spaghett...@googlegroups.com
Ciao ragazzi,
 mi ricollego a questa segnalazione di napo sul Big Data Challenge, per segnalarvi un post con alcuni retroscena sui dati:

Matt
[community manager @ spaziodati] hat on

ps - thread molto stimolante che vale la pena riprendere

Alessio 'Blaster' Biancalana

unread,
Jan 28, 2014, 9:10:09 AM1/28/14
to spaghett...@googlegroups.com
Grande Matt,
Post interessantissimo con tutto quello che c'è dietro. Ho avuto anche modo nei giorni scorsi di riportare i feedback che sono emersi durante questa discussione ad alcuni diretti interessati di Telecom stessa.

Molto bene :)

Ale


2014-01-28 Matteo Brunati <matteo....@gmail.com>

--

Matteo Brunati

unread,
Jan 29, 2014, 3:49:38 AM1/29/14
to spaghett...@googlegroups.com
già :)

e nella parte finale del post ho inserito una piccola anticipazione a cui stiamo lavorando:
"Oltre a tutto questo, in anteprima per i partecipanti al challenge, è disponibile anche il dataGEM delle regioni amministrative di tutta Europa: un insieme di dati creato a partire da fonti ISTAT e EuroStat interrogabile via API. I dati ISTAT sono del 2011, mentre l’aggiornamento per la fonte EuroStat è del 2010. Questo dataGEM è un Open Service di fatto, rilasciato con licenza Creative Commons BY 3.0."

Lo stiamo aggiornando in queste settimane, tra le altre cose, e ne riparleremo sicuramente.
Stiamo anche inserendo i link a fonti Open Data utili per valorizzare il contesto dei dati messi a disposizione, e nei prossimi giorni ne scriveremo ancora, con altri dati che si aggiungono rispetto a quelli elencati.
Occhio che c'è tempo fino al 10/02 per iscriversi al challenge.

 matt

morena ragone

unread,
Jan 29, 2014, 4:31:55 AM1/29/14
to spaghett...@googlegroups.com
Credo anch'io che big e open resteranno su fronti opposti, troppi interessi in gioco. 
Noi restiamo la nicchia, almeno finchè il volume dei dati open non sarà tale da divenire "big" (ossia mai..).
@napo: non condivido l'affermazione per cui alcuni dati si possono aprire, altri no: a parte i soliti (sensibili, giudiziari, etc..), nel rispetto delle leggi si può aprire tutto.
Il problema non è il riutilizzo (che è quello che a noi interessa), ma le informazioni che l'analisi dei dati consente di ottenere...e quella la fai benissimo sui big data, non open.
Scusate la brevità della risposta, mi riservo di ritornarci appena possibile.

Morena

Maurizio Napolitano

unread,
Jan 29, 2014, 4:39:14 AM1/29/14
to Spaghetti Open Data
2014-01-29 morena ragone <mm.r...@gmail.com>:
> Credo anch'io che big e open resteranno su fronti opposti, troppi interessi
> in gioco.
> Noi restiamo la nicchia, almeno finchè il volume dei dati open non sarà tale
> da divenire "big" (ossia mai..).
> @napo: non condivido l'affermazione per cui alcuni dati si possono aprire,
> altri no: a parte i soliti (sensibili, giudiziari, etc..), nel rispetto
> delle leggi si può aprire tutto.

@morena ho detto "dati" e non "dati della pa"
Ammetto che la maggior parte degli open data vengono dalla PA, ma
non è l'unica sorgente.
Rimando a questa lettura
http://www.opendatanow.com/2013/11/new-big-data-vs-open-data-mapping-it-out/
Reply all
Reply to author
Forward
0 new messages