Groups keyboard shortcuts have been updated
Dismiss
See shortcuts

Juriswiki.it - 600 mila sentenze online (o no?)

94 views
Skip to first unread message

Andrea Nelson Mauro

unread,
May 19, 2015, 1:12:28 AM5/19/15
to spaghett...@googlegroups.com
ciao spaghettari,

leggevo questo post di Simone Aliprandi (per chi non lo sapesse, è un e-jurist molto quotato, tra l'altro ha promosso il progetto "Copyleft Italia") che lancia JurisWiki, progetto per raccogliere in formato "aperto" le sentenze italiane, che sarebbero oltre 600mila.

È un esperimento, lo dici lui stesso, ma vedo varie problematiche, ad esempio il fatto che molte sentenze sono "oscurate" per ragioni di privacy e altro.
Insomma, se qualcuno se è già fatto un giro e vuole condividere un'impressione potrebbe essere interessante

bye

Marco Pagliarulo

unread,
May 19, 2015, 6:47:11 AM5/19/15
to spaghett...@googlegroups.com
Andrea il tema privacy è stato affrontato dallo stesso Aliprandi con l'ex garante della privacy Simone Pizzetti http://aliprandi.blogspot.it/2015/05/garante-privacy-juriswiki-sentenze-pizzetti.html
--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.
Per altre opzioni visita https://groups.google.com/d/optout.

monica.palmirani

unread,
May 19, 2015, 7:41:13 AM5/19/15
to spaghett...@googlegroups.com
(prima di tutto scusate il papiro)

L'iniziativa e' interessante, apprezzabile, coraggiosa, fuori dagli schemi e in un certo senso anche provocatoria.

Un sasso nello stagno e, fatte salve le cose che vado a dire sotto, va incoraggiata come va incoraggiata analoga iniziativa presso gli enti istituzionali per spingerli nativamente a rilasciare i dati giuridici (leggi, sentenze, atti parlamentari, verbali di commissione) il più open data possibile.

Personalmente da sempre sono schierata ad affiancare le pubbliche amministrazioni affinchè crescano nella direzione della condivisione delle informazioni autorevoli, autentiche, integre,  ma questa mia visione è l'altra faccia della medaglia di questo servizio. Più i dati/documenti saranno prodotti nativamente digitali e open data, privacy-free dalle istituzioni, più servizi come questi potranno fornire strumenti a valore aggiunto.

Il portale Jriswiki e' utile nel settore giuridico perche' raccoglie con un unico sito integrato cio' che c'e' gia'  disponibile in rete ma distribuito nei vari portali istituzionali. Mi piace l'idea di poter utilizzare dal basso l'esperienza dei giuristi per codificarla e migliorare, in un circolo virtuoso, l'offerta dell'informazione giuridica. Il crowdsourcing per esempio sulla classificazione, anonimizzazione, etc. aiuterebbe moltissimo la qualita'  e la circolabilita'  dell'utilizzo delle sentenze e anche la conoscibilità del sapere giuridico.

Ci sono pero' alcuni aspetti che occorre investigare meglio per raffinare l'iniziativa e renderla solida e duratura nel tempo. L'impresa e' ardua, ma apre uno spiraglio perfettibile in un mondo governato quasi esclusivamente dalle case editrici. Per questo ritengo utile fornire alcune riflessioni in modo costruttivo e ritengo utile questo portale.

Privacy: Le sentenze sono oscurate per motivi di privacy. Spesso sono oscurate alla fonte come da normativa in materia e anzi si dovrebbe secondo molti studiosi oscurare maggiormente i testi specie nelle sentenza penali di cassazione sin dall'origine (e.g. nomi di minori coinvolti in efferati crimini a sfondo sessuale con complicanze sulla salute del minore). Se da un lato troviamo gia'  un ampio dibattito fra il presidente Soro e la Cassazione in materia di oscuramento dei dati personali nelle sentenze pubblicate dalla Suprema Corte nel suo sito (http://www.italgiure.giustizia.it/sncass/), di certo un privato deve porre maggior attenzione perche' non e' coperto dalla finalita' di trattamento e dalla pertinenza (principi sacri alla privacy).

OpenSentenze http://www.opensentenze.it/ e' un gruppo di studiosi che sta conducendo appunto questa analisi da circa un anno per creare delle linee guida da fornire al Ministero della Giustizia in modo da guidare i diversi tribunali ad erogare maggiormente le sentenze in formato aperto, ma nel rispetto dei principi della privacy. E' previsto ad ottobre un convegno su questi temi a Bologna (ci stiamo lavorando!) e gia'  a SOD2015 abbiamo sviluppato un primo nucleo di idee e di tecnologie atte ad anonimizzare le sentenze in modo semi-automatico utilizzando lo standard XML Akoma Ntoso (http://sinatra.cirsfid.unibo.it/portale-anonimizzazione/) e classificazioni NLP. Invito tutto lo staff di JurisWiki ad unirsi a noi in questa iniziativa.

Diritto all'oblio: le sentenze pubblicate dai tribunali non sono indicizzate dai motori di ricerca generalisti (Google, Bing, etc.) sempre seguendo le linee guida del Garante italiano e la normativa della privacy italiana ed europea. La famosa sentenza Googe-Spain della Corte di Giustizia Europea - http://curia.europa.eu/jcms/upload/docs/application/pdf/2014-05/cp140070it.pdf traccia la rotta e impone ai motori di ricerca generalisti di adoperarsi per raccogliere le richieste di rimozione  da parte dei singoli cittadini in caso di pubblicazioni lesive della loro dignità specie se legate a fatti lontani nel tempo. La sentenza impone la cancellazione degli indici nei motori generalisti e non in tutti i casi la richiesta viene accolta (solo il 41,30% delle richieste trova accoglimento si vedano le statistiche fornite da Google http://www.google.com/transparencyreport/removals/europeprivacy/?hl=it). Ciò non di meno ci si chiede se le sentenze pubblicate in questo sito privato, specie contenenti dati personali, non siano già state normate dai numerosi provvedimenti del Garante sottraendole all'indicizzazione dei motori generalisti "by-default". Insomma se la Cassazione non indicizza per non ledere la privacy perchè renderle indicizzabili e addirittura collegate ai cookies e al servizio AdSense?

Uso commerciale: altro aspetto non proprio da trascurare del sito Juriswiki e' il fatto che il portale utilizza questi dati per sviluppare un servizio con ritorno economico mediante inserzioni pubblicitarie basate su AdSense.  Secondo la normativa sulla privacy (italiana ma anche europea) questo non e' permesso specie se si utilizzano dati sensibili di persone fisiche (dati sullo stato di salute soprattutto!) a scopo commerciale. Mi rendo conto che lo sforzo economico dell'iniziativa vada sostenuto e ripagato (capisco tutta la portata del titanico sforzo), ma occorrerebbe trovare un altro modello. Quello suggerito in http://juriswiki.it/pages/about già preannunica l'apertura di un conto Paypal per raccogliere donazioni. Forse la creazione di un'associazione no-profit aiuterebbe a chiarire lo scopo non a fini di lucro dell'iniziativa ma anche questo aspetto andrebbe investigato maggiormente. Altra cosa se le sentenze venissero anonimizzate completamente come fanno le case editrici.

Copyright: andrebbe in realta'  attutita la licenza di "public domain" ora presente nel sito http://juriswiki.it/pages/copyright relativa ai contenuti originali ottenuti dalle fonti sorgenti (dalle corti)  specie se le fonti originali stesse indicano Creative Commons (CC-BY-SA 3.0) vedi la Corte Costituzionale http://www.cortecostituzionale.it/ActionPagina_314.do
Nulla da dire invece sulla licenza Creative Commons Attribution – ShareAlike 4.0 dei contenuti creativi della piattaforma nonchè il copyright "© 2015 JurisWiki | Simone Aliprandi"  immagino per tutelare la creazione originale del servizio e del sito.

L'informativa privacy sui cookies del sito http://juriswiki.it/pages/cookies_policy andrebbero in italiano.

Aspetti tecnologici:
- sarebbe bello avere un'ontologia del mondo giudiziario. A SOD2015 abbiamo iniziato ad imbastirla (attori, azioni, corti, ruoli, documenti, azioni, etc.) e potremmo continuare per applicarla al materiale raccolto
- sarebbe bello avere i testi in XML Akoma Ntoso e collegati all'ontologia per poi farne la trasformazione in triple RDF.
- sarebbe utile avere un punto nel sito o un API dove poter scaricare i testi elaborati e predisposti in CC-BY-SA 4.0 in formato aperto qualsiasi
- sarebbe utile avere i metadati scaricabili appunto in CC-BY-SA 4.0 per poterli raffinare e reinserire
- autenticità delle fonti e provenienza dei metadati, occorre potenziare questo aspetto legato ai contenuti inseriti in crowdsourcing, in questo modo si responsabilizza il commentatore e si attribuisce un cc-by-sa anche a questo commento.

OpenData: non c'è la possibilità ad oggi di scaricare i materiali.

Avanti tutta quindi ma con prudente cautela.
(scusate il papiro)



Il 19/05/2015 07:12, Andrea Nelson Mauro ha scritto:
ciao spaghettari,

leggevo questo post di Simone Aliprandi (per chi non lo sapesse, è un e-jurist molto quotato, tra l'altro ha promosso il progetto "Copyleft Italia") che lancia JurisWiki, progetto per raccogliere in formato "aperto" le sentenze italiane, che sarebbero oltre 600mila.

È un esperimento, lo dici lui stesso, ma vedo varie problematiche, ad esempio il fatto che molte sentenze sono "oscurate" per ragioni di privacy e altro.
Insomma, se qualcuno se è già fatto un giro e vuole condividere un'impressione potrebbe essere interessante

bye
--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.

Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.
Per altre opzioni visita https://groups.google.com/d/optout.


-- 
===================================
Associate professor of Legal Informatics 
School of Law
Alma Mater Studiorum Università di Bologna 
C.I.R.S.F.I.D. http://www.cirsfid.unibo.it/ 
Palazzo Dal Monte Gaudenzi - Via Galliera, 3 
I - 40121 BOLOGNA (ITALY) 
Tel +39 051 277217 
Fax +39 051 260782 
E-mail  monica.p...@unibo.it 
====================================

Alfredo Serafini

unread,
May 19, 2015, 7:47:30 AM5/19/15
to spaghett...@googlegroups.com
credo che Simone ci legga già, in ogni caso ho provato a re-invitarlo a partecipare qui direttamente, sarebbe carino se contribuisse alla discussione :-)

Alfredo Serafini

unread,
May 19, 2015, 7:53:18 AM5/19/15
to spaghett...@googlegroups.com
OpenSentenze http://www.opensentenze.it/ e' un gruppo di studiosi che sta conducendo appunto questa analisi da circa un anno per creare delle linee guida da fornire al Ministero della Giustizia in modo da guidare i diversi tribunali ad erogare maggiormente le sentenze in formato aperto, ma nel rispetto dei principi della privacy. E' previsto ad ottobre un convegno su questi temi a Bologna (ci stiamo lavorando!) e gia'  a SOD2015 abbiamo sviluppato un primo nucleo di idee e di tecnologie atte ad anonimizzare le sentenze in modo semi-automatico utilizzando lo standard XML Akoma Ntoso (http://sinatra.cirsfid.unibo.it/portale-anonimizzazione/) e classificazioni NLP. Invito tutto lo staff di JurisWiki ad unirsi a noi in questa iniziativa.
bello!
 

Aspetti tecnologici: 
- sarebbe bello avere un'ontologia del mondo giudiziario. A SOD2015 abbiamo iniziato ad imbastirla (attori, azioni, corti, ruoli, documenti, azioni, etc.) e potremmo continuare per applicarla al materiale raccolto 
- sarebbe bello avere i testi in XML Akoma Ntoso e collegati all'ontologia per poi farne la trasformazione in triple RDF. 
- sarebbe utile avere un punto nel sito o un API dove poter scaricare i testi elaborati e predisposti in CC-BY-SA 4.0 in formato aperto qualsiasi 
- sarebbe utile avere i metadati scaricabili appunto in CC-BY-SA 4.0 per poterli raffinare e reinserire
- autenticità delle fonti e provenienza dei metadati, occorre potenziare questo aspetto legato ai contenuti inseriti in crowdsourcing, in questo modo si responsabilizza il commentatore e si attribuisce un cc-by-sa anche a questo commento.
sarebbe difatti molto bello sia averli in akoma-ntoso sia avere le API. Se serve supporto per implementare mapping, estrazioni, motori di ricerca ad hoc e API (una qualsiasi o tutte le precedenti) fatemi un fischio che -tempi permettendo- contribuisco molto molto volentieri :-)
 


OpenData: non c'è la possibilità ad oggi di scaricare i materiali.
sottoscrivo: se fossero dati direttamente LOD peraltro si potrebbe facilmente generare a partire da essi dei download "su misura", così come linkarli su altre fonti dati 

Matteo Fortini

unread,
May 21, 2015, 9:16:55 AM5/21/15
to spaghett...@googlegroups.com
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Reply all
Reply to author
Forward
0 new messages