Scraping senza TOS

40 views
Skip to first unread message

Lorenzo Mainardi

unread,
Aug 24, 2017, 4:48:01 AM8/24/17
to Spaghetti Open Data
Buongiorno,
ho un sito che non ha TOS esplicito (o almeno non sono riuscito a trovarlo).

Le informazioni contenute sono facilmente scrapabili.
Secondo voi che siete più esperti in leggi e regolamenti, posso riutilizzarle oppure no?


Giovanni Battista Gallus

unread,
Aug 24, 2017, 5:12:25 AM8/24/17
to spaghett...@googlegroups.com
Sito PA? Yes, si applica l'art. 52 CAD (open by default), salvo che non ci siano dati personali.

Sito non PA? No, sia che le parti "scrapabili" siano opere dell'ingegno, sia che non lo siano, in quanto violeresti il diritto sui generis ex 102 bis LDA (L. 633/41), che vieta l'estrazione della totalità o di "parte sostanziale" di un database.
E non chiedermi di quantificarti la "parte sostanziale" perché non c'è nessuna indicazione specifica e si deve andare caso per caso. E , comunque, l'art. 102 bis aggiunge che " Non sono consentiti l'estrazione o il reimpiego ripetuti e sistematici di parti non sostanziali del contenuto della banca di dati, qualora presuppongano operazioni contrarie alla normale gestione della banca di dati o arrechino un pregiudizio ingiustificato al costitutore della banca di dati".

Un saluto a tutti

G.Battista Gallus





--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopendata+unsubscribe@googlegroups.com.
Visita questo gruppo all'indirizzo https://groups.google.com/group/spaghettiopendata.
Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/spaghettiopendata/a65fb097-94fc-4b76-9a44-25c947edc1df%40googlegroups.com.
Per altre opzioni visita https://groups.google.com/d/optout.

Lorenzo Mainardi

unread,
Aug 24, 2017, 5:56:00 AM8/24/17
to Spaghetti Open Data
Il giorno giovedì 24 agosto 2017 11:12:25 UTC+2, Giovanni Battista Gallus ha scritto:


Sito non PA? No, sia che le parti "scrapabili" siano opere dell'ingegno, sia che non lo siano, in quanto violeresti il diritto sui generis ex 102 bis LDA (L. 633/41), che vieta l'estrazione della totalità o di "parte sostanziale" di un database.
E non chiedermi di quantificarti la "parte sostanziale" perché non c'è nessuna indicazione specifica e si deve andare caso per caso. E , comunque, l'art. 102 bis aggiunge che " Non sono consentiti l'estrazione o il reimpiego ripetuti e sistematici di parti non sostanziali del contenuto della banca di dati, qualora presuppongano operazioni contrarie alla normale gestione della banca di dati o arrechino un pregiudizio ingiustificato al costitutore della banca di dati".

Si tratta di un sito non PA (è il sito della Lega Calcio e vorrei scapare le statistiche).
Quello che hai scritto per me è veramente arabo.
Che vuol dire? Che arrecare un pregiudicio ingiustificato?
Che cosa è una operazione contraria alla normale gestione della banca dati?
 

Maurizio Napolitano

unread,
Aug 24, 2017, 6:06:11 AM8/24/17
to Spaghetti Open Data
> Si tratta di un sito non PA (è il sito della Lega Calcio e vorrei scapare le
> statistiche).

Se è lega calcio non è un sito PA e quindi niente CAD e rischi che
qualcuno si arrabbia.
Poi, il più delle volte, queste azioni sono tollerate (ma se fai
incazzare qualcuno ....)

> Quello che hai scritto per me è veramente arabo.
> Che vuol dire? Che arrecare un pregiudicio ingiustificato?
> Che cosa è una operazione contraria alla normale gestione della banca dati?

Non sono un giurista ma a spanne mi viene da dire che, se qualcuno
della lega calcio si arrabbia, può
tranquillamente farti passare delle noie perchè sei nel torto.

Al di là di questo faccio due segnalazioni un po' OT:
- open data sui diversi campionati di calcio
http://sportsopendata.net/
(uno degli autori è in questa ML)
- hackathon a Trento con la FIGC
http://www.hackathon-figc.unitn.it/it/

Laura Camellini

unread,
Aug 24, 2017, 6:08:01 AM8/24/17
to spaghett...@googlegroups.com
Link utili, come sempre.
Grazie napo

--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopendata+unsubscribe@googlegroups.com.
Visita questo gruppo all'indirizzo https://groups.google.com/group/spaghettiopendata.

Lorenzo Mainardi

unread,
Aug 24, 2017, 6:27:01 AM8/24/17
to Spaghetti Open Data
Il giorno giovedì 24 agosto 2017 12:06:11 UTC+2, napo ha scritto:
 
Al di là di questo faccio due segnalazioni un po'  OT:
- open data sui diversi campionati di calcio
http://sportsopendata.net/
(uno degli autori è in questa ML)

L'ho visto. Ma mancano un sacco di dati statistici che sull'altro sito sono presenti.
 
- hackathon a Trento con la FIGC
http://www.hackathon-figc.unitn.it/it/

Interessante...

Maurizio Napolitano

unread,
Aug 24, 2017, 7:18:23 AM8/24/17
to Spaghetti Open Data
>
> L'ho visto. Ma mancano un sacco di dati statistici che sull'altro sito sono
> presenti.

... probabilmente per un problema di permessi di riuso dei dati :/

>> - hackathon a Trento con la FIGC
>> http://www.hackathon-figc.unitn.it/it/
>
>
> Interessante...

potresti venire e presentare il tuo progetto, a quel punto è probabile che trovi
qualcuno di Lega Calcio che ragiona sull'accesso a quei dati.

Giovanni Battista Gallus

unread,
Aug 24, 2017, 7:25:45 AM8/24/17
to spaghett...@googlegroups.com
Il giorno 24 agosto 2017 11:56, Lorenzo Mainardi <lorm...@gmail.com> ha scritto:
Il giorno giovedì 24 agosto 2017 11:12:25 UTC+2, Giovanni Battista Gallus ha scritto:


Sito non PA? No, sia che le parti "scrapabili" siano opere dell'ingegno, sia che non lo siano, in quanto violeresti il diritto sui generis ex 102 bis LDA (L. 633/41), che vieta l'estrazione della totalità o di "parte sostanziale" di un database.
E non chiedermi di quantificarti la "parte sostanziale" perché non c'è nessuna indicazione specifica e si deve andare caso per caso. E , comunque, l'art. 102 bis aggiunge che " Non sono consentiti l'estrazione o il reimpiego ripetuti e sistematici di parti non sostanziali del contenuto della banca di dati, qualora presuppongano operazioni contrarie alla normale gestione della banca di dati o arrechino un pregiudizio ingiustificato al costitutore della banca di dati".

Si tratta di un sito non PA (è il sito della Lega Calcio e vorrei scapare le statistiche).

Ok, allora niente CAD
 
Quello che hai scritto per me è veramente arabo.

Non lo ho scritto io, è la legge sul diritto d'autore. Semmai è legalese :-))
 
Che vuol dire? Che arrecare un pregiudicio ingiustificato?
Che cosa è una operazione contraria alla normale gestione della banca dati?

Che voglia dire lo stabilisce il giudice.
E' ovvio che sono ingiustificate tutte quelle condotte a fini commerciali, ma non è scontato che le condotte a fini non commerciali non rechino lo stesso un "pregiudizio ingiustificato". Fossi nel titolare del sito, e volessi rompere le scatole, direi due cose: 1) le statistiche sono una banca dati a sè, indipendente dal sito, e lo scraping di tutte le stats è quindi vietato a priori; oppure 2) il sottrarre sistematicamente o ripetutamente le statistiche, e pubblicarle altrove, mi devia il traffico dal sito, e quindi mi arreca un pregiudizio ingiustificato.

Insomma, io ci andrei molto cauto...

Ciao

G.Battista
 

morena ragone

unread,
Aug 24, 2017, 8:00:39 AM8/24/17
to Spaghetti Open Data
Ciao Lorenzo, qui c'è qualcosa in merito che ho scritto tempo fa
http://www.ingenium-magazine.it/scraping-di-dati-dai-siti-si-puo/
Visto che non è PA e senza TOS, perché non provi a chiedere il riutilizzo dei dati che ti servono? Non si sa mai.. ;)
Se serve aiuto, fammi sapere.
Morena

Lorenzo Mainardi

unread,
Aug 24, 2017, 8:12:46 AM8/24/17
to Spaghetti Open Data


Il giorno giovedì 24 agosto 2017 13:18:23 UTC+2, napo ha scritto:

potresti venire e presentare il tuo progetto, a quel punto è probabile che trovi
qualcuno di Lega Calcio che ragiona sull'accesso a quei dati.

Trento mi rimane un po' scomodo, ma non sarebbe davvero una cattiva idea :)

Paolo Riva

unread,
Aug 24, 2017, 8:28:14 AM8/24/17
to Spaghetti Open Data
Ciao Lorenzo,
sono Paolo e come ti aveva segnalato Maurizio ho fondato con alcuni amici il servizio Sports Open Data.

Come giustamente hai analizzato anche tu c'è un grosso problema di fondo sulla tipologia di dati che sono scrapabili e quali no: molti dati infatti non sono riusabili dai siti che hai citato proprio perchè, in quanto di proprietà di chi li fornisce, diciamo che l'azione "è permessa finchè non fai una sgarbo a chi li mostra".

Tieni conto che l'Open Data, in quanto tale, ti permette di avere un grande potere a livello di proprietà del dato: se tu distribuisci un dato che è COMPLETAMENTE riutilizzabile da chiunque di cui un altro, in realtà, ha la proprietà non è che sia proprio ben visto come azione.

Noi da circa 2 anni stiamo facendo un lavoro molto importante a livello di policies per capire "cosa possiamo fare", ma soprattutto "come possiamo fare" e il risultato è quello che puoi vedere sul nostro servizio: poco o tanto difficile stimarlo, importante invece è l'approccio di continua ricerca nel cercare di dare sempre qualcosa di più.

Stiamo infatti lavorando ad un servizio open data in real time che dovrebbe essere un'assoluta novità nel campo con dati traccati direttamente da persone fisiche che monitorano i match: anche in questo caso mi dirai "ci sono centinaia di società che lo fanno", ma non lo fanno rilasciando l'Open Data e difficilmente lo faranno mai (perchè perderebbero il loro business).

Se hai qualsiasi dubbio o domanda in merito non farti problemi a contattarmi, mi trovi sia qui che su skype (poi trovi i contatti sul mio sito): se hai voglia di portare un progetto all'hackaton facci sapere che possiamo capire come distribuire i dati che ti servono per farti presentare un progetto interessante.

Fammi sapere.
Ciao Paolo.

--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.

Visita questo gruppo all'indirizzo https://groups.google.com/group/spaghettiopendata.
Reply all
Reply to author
Forward
0 new messages