Come funziona il workflow dei dati sul coronavirus?

31 views
Skip to first unread message

Alberto

unread,
Mar 25, 2020, 2:03:02 PM3/25/20
to Spaghetti Open Data
Un po' in tutta Europa stanno scoprendo lo stesso problema che molti di voi hanno segnalato, e cioè che i dati su COVID-19 non sono sempre open, non sono documentati bene, non sono curati bene, e il risultato è che non si capisce una mazza.

Sto discutendo con un gruppo di opendatari belgi, che sono messi peggio di noi. Fatemi capire come funziona il workflow da noi: è regione => Ministero della salute => Protezione Civile?

Sono le Regioni ad avere i dati originari? E non sono open? O sono open solo in qualche regione?

(Scusate la sprovvedutaggine)

Francesco Piero Paolicelli

unread,
Mar 25, 2020, 4:45:53 PM3/25/20
to spaghett...@googlegroups.com
Ministero Sanità e ISS ricevono da Asl regionali e danno a PTC.
ISS fa poi il controllo epidemiologico a posteriori ufficiale (le morti con o per coronavirus) e fa reportistica settimanale con % per fasce d’età .
PTC invece pubblica json e csv su andamenti nazionali, provinciali e regionali.

Oggi sono emerse un po’ di cavolate fatte da alcune Regioni che non seguono la circolare ministeriale per la definizione di soggetto infetto (doppio tampone etc). ecco perchè ci sono numeri pubblicati a livello locale che sono lontani anni luce dai dati PTC. 

proprio da stasera c’è la sezione documentata sulla repo della prot civile:



Piersoft
Inviato da iPhone

Il giorno 25 mar 2020, alle ore 19:03, Alberto <alberto...@gmail.com> ha scritto:


--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/spaghettiopendata/f22c5b6b-3e50-4482-a0c5-c4e392eca447%40googlegroups.com.

Daniele Crespi

unread,
Mar 26, 2020, 4:45:47 AM3/26/20
to spaghett...@googlegroups.com
penso che ASL/ULSS/ATS o come diavolo si chiamano nelle varie Regioni, facciano confluire i dati a livello Regionale alla Direzione Generale Sanità e poi un unico flusso regionale è inviato al DPC (Dip. Prot. Civ,)

la definizione migliore della situazione secondo me è "caos"

in ogni caso, provo a dare la mia opinione

inseguire la pubblicazione dei dati da parte delle regioni è rischioso, in quanto sono 21 soggetti diversi e la probabilità che tutti e 21 pubblichino dati omogenei è prossima allo zero

molto meglio insistere affinchè il DPC pubblichi i dati con il massimo dettaglio possibile

in primis sarebbe utile scoprire con quale livello di dettaglio gli arrivano i dati, es. sono a livello comunale ? sono corredati di fascia d'età , etc

io immagino di sì, e quindi insisterei a fare pressione sul DPC perchè pubblichi il maggior dettaglio possibile

my2cents
daniele

Alberto

unread,
Mar 26, 2020, 5:10:53 AM3/26/20
to Spaghetti Open Data
Grazie, Daniele. Ma a occhio il DPC può pubblicare quello che ha, non quello che non ha. Quando gli open data nazionali sono belli puliti (tipo OpenCoesione) è perché il dato grezzo non è un dato di gestione, ma un dato di monitoraggio, e il monitoraggio sta in capo al governo centrale. Quindi loro generano i loro dati, li puliscono, li standardizzano, e li pubblicano, e lì va tutto bene.

Second best sarebbe che il DPC pubblicasse tutti i metadati delle 21 regioni: 21 definizioni di "accertati", 21 definizioni di "guariti", 21 orari di aggiornamento dei dati etc. Ma la vedo dura.

Nino Galante

unread,
Mar 26, 2020, 5:57:54 AM3/26/20
to Spaghetti Open Data
Qui in Sicilia i bollettini quotidiani pubblicati intorno alle 12 dicono che i dati sono quelli inviati a Roma alla Protezione Civile. Il problema è che la Protezione Civile nel fornire il dettaglio provinciale si limita soltanto al "totale_casi" mentre a livello regionale li espone (in un altro file) in maniera completa. Il comunicato regionale (un classico comunicato stampa) invece espone in più, rispetto alla Protezione Civile, alcuni dati dettagliati a livello provinciale, ma non tutti. Quindi, quando si tenta di costruire un dataset con la stessa tipologia di dati usata dalla Protezione Civile, la difficoltà nasce dal fatto che la regione ne fornisce solo alcuni; ad esempio, il dato dei ricoverati in terapia intensiva è regionale mentre quello dei guariti è sia regionale che dettagliato per provincia. 

È per questo che a nome di Open Data Sicilia, abbiamo deciso di inviare una lettera aperta all'amministrazione regionale nella quale chiediamo che i dati, nel loro dettaglio provinciale, siano completi e strutturati secondo il modello della Protezione Civile (a cui li inviano sommando i dati locali per determinare i valori regionali.

Quindi il nostro intento non è duplicare dati esistenti ma integrarli con dati dettagliati a livello provinciale e possibilmente anche comunale (nella lettera aperta chiediamo il rilascio anche di altri tipi di dati mancanti sia a livello locale che nazionale).

Personalmente anche a me starebbe bene che questo ulteriore livello di dettaglio fosse reso disponibile dalla Protezione Civile ma noi come comunità locale ci siamo dichiarati eventualmente disponibili a supportare l'amministrazione regionale con il nostro contributo.

La lettera è stata pubblicata il 23 Marzo e siamo in attesa di una risposta, ma personalmente penso che il problema sia ancora una volta, e come spesso succede, di tipo culturale e che non sia ancora maturata la sensibilità e la consapevolezza in molte amministrazioni di quanto sia importante esporre al meglio i dati (che, tra l'altro, già posseggono).

N.G.

Maurizio Napolitano

unread,
Mar 27, 2020, 2:23:13 PM3/27/20
to Spaghetti Open Data
Ciao Alberto
aggiungo una nota su quello che accade in Trentino visto che vedi
stupidi attacchi gratuiti che non vanno a capire le questioni.

Premessa:
non mi occupo della questione in prima persona ed anche io non sono
contento di vedere dati che *apparentemente* non tornato.

Facendo un confronto fra i dati che pubblica APSS - Azienda della
Provincia autonoma di Trento per i Servizi Sanitari sui questi due
siti:
https://covid19trentino.fbk.eu
https://patn.maps.arcgis.com/apps/opsdashboard/index.html#/345e288061094c248e44fd4f5c5cda3a
e con quelli della Protezione Civile, sembra che nulla sia coordinato,
poi, guardando e leggendo i comunicati stampa che la Provincia
pubblica quotidianamente, si scopre che il problema è tutto nelle
definizioni.

Un paio di esempi:
- contagiati:
chiunque risulta positivo ad un tampone oppure chiunque è stato vicino
ad una persona con covid-19 a prescindere che abbia il covid-19?
- domicilio
si contano anche le persone nelle case di riposo o no?
La casa di riposo non è il domicilio di una persona e non nemmeno un
ricovero ospedaliero

La protezione civile spiega esattamente cosa sono queste definizioni e
le pubbliche amministrazioni rispondono inviando i dati.
A quel punto succede che le persone in RSA non vengono conteggiate o
che, si invia il totale delle persone di cui si è sicuri di avere lo
stato di contagio ed altro ancora.

Queste sono mie supposizioni, solo che, quando faccio i conti, dalle
fonti segnalate sopra, vedo che tutto rientra e capisco anche il
problema.

Come dice Daniele sicuramente c'è molta confusione.
Conto sul fatto che si risolva.

In realtà, sappiamo benissimo, che sono i micro-dati che fanno la
differenza per capire come combattere questa situazione.
E quelli non si possono dare.

Sono anche rimasto molto stupito da vedere che, in alcuni casi,
vengono segnalati situazioni in comuni molto piccoli dove si ha un
solo contagiato con il potenziale effetto che possa far scattare la
caccia alle streghe ...











On Thu, Mar 26, 2020 at 10:10 AM Alberto <alberto...@gmail.com> wrote:
>
> Grazie, Daniele. Ma a occhio il DPC può pubblicare quello che ha, non quello che non ha. Quando gli open data nazionali sono belli puliti (tipo OpenCoesione) è perché il dato grezzo non è un dato di gestione, ma un dato di monitoraggio, e il monitoraggio sta in capo al governo centrale. Quindi loro generano i loro dati, li puliscono, li standardizzano, e li pubblicano, e lì va tutto bene.
>
> Second best sarebbe che il DPC pubblicasse tutti i metadati delle 21 regioni: 21 definizioni di "accertati", 21 definizioni di "guariti", 21 orari di aggiornamento dei dati etc. Ma la vedo dura.
>
> --
> Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
> Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
> Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/spaghettiopendata/a9d544b1-c5f8-4e58-9812-2a2a79a1ff66%40googlegroups.com.



--
Maurizio "Napo" Napolitano
http://de.straba.us
Reply all
Reply to author
Forward
0 new messages