Adopta un senador

43 views
Skip to first unread message

David Cabo

unread,
Sep 8, 2011, 8:13:52 PM9/8/11
to pro-bono...@googlegroups.com
Hola a todos,

Como sabéis hace unas horas se publicaron las declaraciones de bienes
de diputados y senadores, pero en PDFs que son imágenes escaneadas de
los formularios en papel, de los que no se pueden sacar los datos
automáticamente. He montado un pequeño experimento de crowdsourcing a
ver si entre todos conseguimos convertirlos, siguiendo el ejemplo del
The Guardian con las dietas de los diputados y similares. Javier de la
Cueva lo explica mejor que yo [1].

Así que podéis pasaros por este documento de Google Docs [2] y
adoptar un senador. (La web del congreso todavía va muy mal, así que
empezamos por aquí a ver si funciona.)


Un saludo,

/david

[1]: http://derecho-internet.org/node/569
[2]: https://docs.google.com/spreadsheet/ccc?key=0AowzHU9kHzeudG9aSjVVOEQxVHpzR2E4ZDdhVXJLQlE&hl=en_US#gid=0

J. Félix Ontañón

unread,
Sep 9, 2011, 3:34:07 AM9/9/11
to pro-bono...@googlegroups.com
El día 9 de septiembre de 2011 02:13, David Cabo
<david...@gmail.com> escribió:

Me parece una iniciativa estupenda a la que me sumo sin duda.
Entiendo que puede hacerse difusión de esto más allá de este foro, ¿me equivoco?
¿Hay alguien encargado de la vigilancia anti-vandalismo?

Un saludo,

--
J. Félix Ontañón Carmona

mar cabra valero

unread,
Sep 9, 2011, 4:10:59 AM9/9/11
to lista de probono publico
Qué grande! Sabéis que la web del Congreso ha tenido problemas varias veces por la cantidad de visitas? Aunque como siempre, muchos han declarado lo que les ha dado la gana... Felicidades por la iniciativa, David.

Por mi deconocimiento técnico me planteo: sería lo mismo pedir en papel esto e intentar escanear nosotros los papeles con un buen OCR?

Mar

David Cabo

unread,
Sep 9, 2011, 4:15:38 AM9/9/11
to pro-bono...@googlegroups.com
> Entiendo que puede hacerse difusión de esto más allá de este foro, ¿me equivoco?

sí, sí, claro. está en la portada de Menéame...

> ¿Hay alguien encargado de la vigilancia anti-vandalismo?

Google Docs guarda el historial de cambios, y yo iré guardando copias
por si acaso. Supongo que lo mejor será ponerlo en modo "sólo lectura"
una vez esté completo para poder revisarlo, por si a alguien le da por
cambiar algo. (Otra opción es volver a hacerlo todo y comparar, pero
no me parece lo más eficiente.)

/david

David Cabo

unread,
Sep 9, 2011, 4:18:19 AM9/9/11
to pro-bono...@googlegroups.com
> Qué grande! Sabéis que la web del Congreso ha tenido problemas varias veces
> por la cantidad de visitas? Aunque como siempre, muchos han declarado lo que
> les ha dado la gana... Felicidades por la iniciativa, David.

Sí, quería hacer los diputados también, pero hasta que no se arregle
la web no se puede.

Ahora le toca a los periodistas desmontar las mentiras. ;)

> Por mi deconocimiento técnico me planteo: sería lo mismo pedir en papel esto
> e intentar escanear nosotros los papeles con un buen OCR?

Se puede intentar, pero yo creo que al ser formularios complejos es
mucho trabajo. El Abbyy Reader te convierte el PDF en un Excel, pero
luego tendrías que copiar los datos de cada senador a otro sitio y
tal. Y además hay alguna declaración que se ve muy mal. Es otro
camino, pero si funciona el crowdsourcing ideal...

/david

Jose del Moral

unread,
Sep 9, 2011, 4:40:11 AM9/9/11
to pro-bono...@googlegroups.com
Gran iniciativa.

El problema efectivamente es que hay falsedades. Yo ya he detectado
una muy grave con la declaración de la cuota de IRPF (a la que hay que
añadir las retenciones practicadas). Se evidencia la falsedad porque
algunos están poniendo cuotas negativas (sería imposible si realmente
sumaran las retenciones practicadas).

jose

2011/9/9 David Cabo <david...@gmail.com>:

mar cabra valero

unread,
Sep 9, 2011, 5:10:51 AM9/9/11
to lista de probono publico
Jose,

Yo no sé si eres periodista, pero si no - periodistas de la lista: esa es una gran noticia!!!! Alguien la puede publicar? (ya ya, habría que mirarlo en detalle, pero me parece interesante). No estoy diciendo que haya maldad, pero así les empujamos a que en la nueva legislatura, cuando lo tengan que volver a hacer, se cuiden un poquito más. Me pregunto si hay alguien en los partidos que se haya dedicado a preparar esto o lo han hecho ellos solitos... ese podría ser otro tema.

Mar

> Date: Fri, 9 Sep 2011 10:40:11 +0200
> Subject: Re: Adopta un senador
> From: eus...@gmail.com
> To: pro-bono...@googlegroups.com

Jose del Moral

unread,
Sep 9, 2011, 5:37:00 AM9/9/11
to pro-bono...@googlegroups.com
Soy un simple bloguero :-(

2011/9/9 mar cabra valero <marcabr...@hotmail.com>:

David Cabo

unread,
Sep 9, 2011, 6:48:12 AM9/9/11
to pro-bono...@googlegroups.com
También puedes adoptar un diputado, necesitan tu cariño ;)

https://docs.google.com/spreadsheet/ccc?key=0AowzHU9kHzeudHlSemNzcVc2OTRqd05YbnkxdUlhMWc&hl=en_US

/david

2011/9/9 David Cabo <david...@gmail.com>:

Francesco Cardi

unread,
Sep 9, 2011, 6:53:49 AM9/9/11
to pro-bono...@googlegroups.com
Maravillosa iniciativa!

2011/9/9 David Cabo <david...@gmail.com>:

Jacobo Elosua

unread,
Sep 9, 2011, 7:47:13 AM9/9/11
to pro bono publico
Casi la mitad de los senadores están ya adoptados. Cuál sería un buen
proceso de revisión? Una nueva columna con un checker cuando el
adoptante ya haya puesto la celda con el nombre del senador en verde?

En el campo "Fecha declaración" se están metiendo muchas fechas de
acreditación, al estar incluido el campo antes de la circunscripción,
y venir la info de las fichas en ese orden.
> [2]:https://docs.google.com/spreadsheet/ccc?key=0AowzHU9kHzeudG9aSjVVOEQx...

Francesco Cardi

unread,
Sep 9, 2011, 7:56:55 AM9/9/11
to pro-bono...@googlegroups.com
Pergunta quizas ingenua: como nos protegemos del hecho que un vandalo
poderia entrar en el fichero y cancelar todo? Tenemos copia de backup?

Gracias
Francesco

2011/9/9 Jacobo Elosua <jacobo...@gmail.com>:

Aitor Garcia Rey

unread,
Sep 9, 2011, 8:13:22 AM9/9/11
to pro-bono...@googlegroups.com
Buenas,

2011/9/9 Francesco Cardi <frances...@gmail.com>:


> Pergunta quizas ingenua: como nos protegemos del hecho que un vandalo
> poderia entrar en el fichero y cancelar todo? Tenemos copia de backup?

David comentaba más arriba que esta haciendo copias de backup
periodicamente si no me equivoco.

--
Kind Regards,
Aitor Garcia
Simple registration for your events - http://www.stagehq.com
Founder Linking Paths - http://www.linkingpaths.com

Aitor Garcia Rey

unread,
Sep 9, 2011, 8:15:11 AM9/9/11
to pro-bono...@googlegroups.com
Buenas,

2011/9/9 Jacobo Elosua <jacobo...@gmail.com>:


> Casi la mitad de los senadores están ya adoptados. Cuál sería un buen
> proceso de revisión? Una nueva columna con un checker cuando el
> adoptante ya haya puesto la celda con el nombre del senador en verde?

Puede ser que con esa columna sea suficiente sí. En cualquier caso
David, ya sabes que si necesitas algo de fuerza de desarrollo para
automatizar algo en esta lista "habemus" unos cuantos XD.

--
Kind Regards,
Aitor Garcia

Pro Bono Publico - http://www.probp.org

David Cabo

unread,
Sep 9, 2011, 9:34:14 AM9/9/11
to pro-bono...@googlegroups.com, pro-bono...@googlegroups.com
Y google docs guarda revision de cambios ademas.

Alguien decia en twitter que se eataban borrando cosas. Si eso desactivamos edicion anonima y exijimos estar registrado...

Sent from my iPhone

Aitor Garcia Rey

unread,
Sep 9, 2011, 9:40:58 AM9/9/11
to pro-bono...@googlegroups.com
Buenas,

2011/9/9 David Cabo <david...@gmail.com>:


> Alguien decia en twitter que se eataban borrando cosas. Si eso desactivamos edicion anonima y exijimos estar registrado...

+1 total.

Miguel Arroyo Pérez

unread,
Sep 9, 2011, 10:00:13 AM9/9/11
to pro-bono...@googlegroups.com
Me parece lo más correcto, no creo que nadie que colabore en integrar información tenga impedimento para registrarse.

Un abrazo y enhorabuena por el proyecto

Miguel Arroyo Pérez
map...@maperon.com
600474222

-----Mensaje original-----
De: pro-bono...@googlegroups.com [mailto:pro-bono...@googlegroups.com] En nombre de Aitor Garcia Rey
Enviado el: viernes, 09 de septiembre de 2011 15:41
Para: pro-bono...@googlegroups.com
Asunto: Re: Adopta un senador

Francesco Cardi

unread,
Sep 9, 2011, 9:55:44 AM9/9/11
to pro-bono...@googlegroups.com
> Me parece lo más correcto, no creo que nadie que colabore en integrar información tenga impedimento para registrarse.

+1

A medida que este fichero se queda conocido, un troll u otro siempre llega.

Saludos
Francesco

2011/9/9 Miguel Arroyo Pérez <map...@maperon.com>:

David Cabo

unread,
Sep 9, 2011, 10:20:19 AM9/9/11
to pro-bono...@googlegroups.com
>> Me parece lo más correcto, no creo que nadie que colabore en integrar información tenga impedimento para registrarse.
>
> +1

He restaurado la versión de hace hora y media, porque alguien había
borrado las cabeceras y desordenado las cosas, era un caos.

Por lo visto recordaba mal, en Google Docs no puedes decir "cualquiera
puede editar, pero registrado", o igual me equivoco: parece que hay
que listar a los editores explícitamente. No es que sea el fin del
mundo, pero sí que introduce un elemento burocrático un poco
tocapelotas.

Sugerencias?

Francesco Cardi

unread,
Sep 9, 2011, 10:21:34 AM9/9/11
to pro-bono...@googlegroups.com
onestamente yo no veo alternativas ...

2011/9/9 David Cabo <david...@gmail.com>:

Ruth del Campo

unread,
Sep 9, 2011, 10:33:17 AM9/9/11
to pro bono publico
Enhorabuena David,

Una iniciativa estupenda... yo estuve ayer peleandome con el BOE
buscando los datos....las noticias no decían donde estaban publicados!
Que bien que lo hayas puesto en marcha.


On Sep 9, 10:21 am, Francesco Cardi <francesco.ca...@gmail.com> wrote:
> onestamente yo no veo alternativas ...
>
> 2011/9/9 David Cabo <david.c...@gmail.com>:

Álvaro Ortiz

unread,
Sep 9, 2011, 2:13:11 PM9/9/11
to pro-bono...@googlegroups.com
> Sugerencias?

Que escriba un mail a esta lista presentándose?

David Cabo

unread,
Sep 9, 2011, 2:18:56 PM9/9/11
to pro-bono...@googlegroups.com, pro-bono...@googlegroups.com
Se ha calmado la oleada de la tarde, q creo era gente aburrida en la ofi leyendo meneame. Todo tranquilo ahora.

Me he ido de cañas para pensar :)

Sent from my iPhone

mar cabra valero

unread,
Sep 9, 2011, 2:24:05 PM9/9/11
to lista de probono publico
> las noticias no decían donde estaban publicados!

Yo tb he notado que les faltaban un par de links... aunque El País ha puesto para descargar un par de ellos, lo cual es un avance informativo brutal. :)

mar

mar canet sola

unread,
Sep 9, 2011, 5:39:23 PM9/9/11
to pro-bono...@googlegroups.com
Hola Jose,

si supieras hacer una regla de excel se podrian marcar rapidamente los
que hagan cosas asi.

saludos,

Mar Canet


2011/9/9 Jose del Moral <eus...@gmail.com>:

alberto

unread,
Sep 9, 2011, 8:01:38 PM9/9/11
to pro-bono...@googlegroups.com
David dame permisossssss a alberto...@gmail.com q no se puede editar y han hecho unas cuantas barrabasadas.

Se me ocurre que se haga  un form por que ese se puede restringir a añadir únicamente y si alguien pone chorradas se borra la linea muy fácil.

Salu2

David Cabo

unread,
Sep 9, 2011, 8:10:40 PM9/9/11
to pro-bono...@googlegroups.com
> David dame permisossssss a alberto...@gmail.com q no se puede editar y
> han hecho unas cuantas barrabasadas.

Hecho (puede que tengas que volver a abrir el fichero). He desactivado
el acceso anónimo hace un rato porque han borrado toda la excel y han
puesto spam. Cosas de salir en El País imagino. He restaurado el
fichero a una versión que parecía estar bien, pero si se me ha pasado
algo me dices. (De todas formas luego hay que revisarlo.)

> Se me ocurre que se haga  un form por que ese se puede restringir a añadir
> únicamente y si alguien pone chorradas se borra la linea muy fácil.

Sí, buena idea. El problema sería entonces saber qué diputado hacer
cada uno. Lo hablamos mañana... aunque el de los senadores está casi
hecho, con unas pocas personas motivadas que pidan permiso para editar
ya se termina.

Está siendo un experimento interesante...

/david

J. Félix Ontañón

unread,
Sep 9, 2011, 4:44:46 AM9/9/11
to pro-bono...@googlegroups.com
El día 9 de septiembre de 2011 10:40, Jose del Moral
<eus...@gmail.com> escribió:

> Gran iniciativa.
>
> El problema efectivamente es que hay falsedades. Yo ya he detectado
> una muy grave con la declaración de la cuota de IRPF (a la que hay que
> añadir las retenciones practicadas). Se evidencia la falsedad porque
> algunos están poniendo cuotas negativas (sería imposible si realmente
> sumaran las retenciones practicadas).
>
> jose

Buenas Jose,

En lo que, espero, coincidamos, es que tras el esfuerzo colectivo de
transformar a formato "machine-readable" (si se me permite hablar en
awful inglis) será mucho más sencillo analizar de forma agregada los
datos y realizar detección de irregularidades como la que comentas.

Creo que merece la pena.

> 2011/9/9 David Cabo <david...@gmail.com>:
>>  Hola a todos,
>>
>>  Como sabéis hace unas horas se publicaron las declaraciones de bienes
>> de diputados y senadores, pero en PDFs que son imágenes escaneadas de
>> los formularios en papel, de los que no se pueden sacar los datos
>> automáticamente. He montado un pequeño experimento de crowdsourcing a
>> ver si entre todos conseguimos convertirlos, siguiendo el ejemplo del
>> The Guardian con las dietas de los diputados y similares. Javier de la
>> Cueva lo explica mejor que yo [1].
>>
>>  Así que podéis pasaros por este documento de Google Docs [2] y
>> adoptar un senador. (La web del congreso todavía va muy mal, así que
>> empezamos por aquí a ver si funciona.)
>>
>>
>>  Un saludo,
>>
>> /david
>>
>> [1]: http://derecho-internet.org/node/569
>> [2]: https://docs.google.com/spreadsheet/ccc?key=0AowzHU9kHzeudG9aSjVVOEQxVHpzR2E4ZDdhVXJLQlE&hl=en_US#gid=0
>>
>

--
J. Félix Ontañón Carmona

Jose del Moral

unread,
Sep 11, 2011, 12:14:54 PM9/11/11
to pro-bono...@googlegroups.com
Desde luego. Solo advierto de los problemas que va a dar comparar a
todos por igual ;-)

Carlos J. Gil Bellosta

unread,
Sep 12, 2011, 7:08:52 AM9/12/11
to pro-bono...@googlegroups.com
Hola, ¿qué tal?

No sé si valdría la pena después subir el fichero a ManyEyes
(http://www-958.ibm.com/software/data/cognos/manyeyes/) o a Google
Fusion Tables (http://www.google.com/fusiontables/Home?pli=1) para ver
qué visualizaciones (y otras cosas) puede hacer la gente con esos
datos.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 11 de septiembre de 2011 18:14, Jose del Moral
<eus...@gmail.com> escribió:

David Cabo

unread,
Sep 12, 2011, 5:01:10 PM9/12/11
to pro-bono...@googlegroups.com
Hola,

> No sé si valdría la pena después subir el fichero a ManyEyes
> (http://www-958.ibm.com/software/data/cognos/manyeyes/) o a Google
> Fusion Tables (http://www.google.com/fusiontables/Home?pli=1) para ver
> qué visualizaciones (y otras cosas) puede hacer la gente con esos
> datos.

Los diputados aún no están listos, pero la hoja de senadores está
completa ya: http://bit.ly/qL9efc

Así que si alguien quiere jugar con los datos y visualizarlos, adelante!

/david

Reply all
Reply to author
Forward
0 new messages