Como sabéis hace unas horas se publicaron las declaraciones de bienes
de diputados y senadores, pero en PDFs que son imágenes escaneadas de
los formularios en papel, de los que no se pueden sacar los datos
automáticamente. He montado un pequeño experimento de crowdsourcing a
ver si entre todos conseguimos convertirlos, siguiendo el ejemplo del
The Guardian con las dietas de los diputados y similares. Javier de la
Cueva lo explica mejor que yo [1].
Así que podéis pasaros por este documento de Google Docs [2] y
adoptar un senador. (La web del congreso todavía va muy mal, así que
empezamos por aquí a ver si funciona.)
Un saludo,
/david
[1]: http://derecho-internet.org/node/569
[2]: https://docs.google.com/spreadsheet/ccc?key=0AowzHU9kHzeudG9aSjVVOEQxVHpzR2E4ZDdhVXJLQlE&hl=en_US#gid=0
Me parece una iniciativa estupenda a la que me sumo sin duda.
Entiendo que puede hacerse difusión de esto más allá de este foro, ¿me equivoco?
¿Hay alguien encargado de la vigilancia anti-vandalismo?
Un saludo,
--
J. Félix Ontañón Carmona
sí, sí, claro. está en la portada de Menéame...
> ¿Hay alguien encargado de la vigilancia anti-vandalismo?
Google Docs guarda el historial de cambios, y yo iré guardando copias
por si acaso. Supongo que lo mejor será ponerlo en modo "sólo lectura"
una vez esté completo para poder revisarlo, por si a alguien le da por
cambiar algo. (Otra opción es volver a hacerlo todo y comparar, pero
no me parece lo más eficiente.)
/david
Sí, quería hacer los diputados también, pero hasta que no se arregle
la web no se puede.
Ahora le toca a los periodistas desmontar las mentiras. ;)
> Por mi deconocimiento técnico me planteo: sería lo mismo pedir en papel esto
> e intentar escanear nosotros los papeles con un buen OCR?
Se puede intentar, pero yo creo que al ser formularios complejos es
mucho trabajo. El Abbyy Reader te convierte el PDF en un Excel, pero
luego tendrías que copiar los datos de cada senador a otro sitio y
tal. Y además hay alguna declaración que se ve muy mal. Es otro
camino, pero si funciona el crowdsourcing ideal...
/david
El problema efectivamente es que hay falsedades. Yo ya he detectado
una muy grave con la declaración de la cuota de IRPF (a la que hay que
añadir las retenciones practicadas). Se evidencia la falsedad porque
algunos están poniendo cuotas negativas (sería imposible si realmente
sumaran las retenciones practicadas).
jose
2011/9/9 David Cabo <david...@gmail.com>:
2011/9/9 mar cabra valero <marcabr...@hotmail.com>:
https://docs.google.com/spreadsheet/ccc?key=0AowzHU9kHzeudHlSemNzcVc2OTRqd05YbnkxdUlhMWc&hl=en_US
/david
2011/9/9 David Cabo <david...@gmail.com>:
2011/9/9 David Cabo <david...@gmail.com>:
Gracias
Francesco
2011/9/9 Jacobo Elosua <jacobo...@gmail.com>:
2011/9/9 Francesco Cardi <frances...@gmail.com>:
> Pergunta quizas ingenua: como nos protegemos del hecho que un vandalo
> poderia entrar en el fichero y cancelar todo? Tenemos copia de backup?
David comentaba más arriba que esta haciendo copias de backup
periodicamente si no me equivoco.
--
Kind Regards,
Aitor Garcia
Simple registration for your events - http://www.stagehq.com
Founder Linking Paths - http://www.linkingpaths.com
2011/9/9 Jacobo Elosua <jacobo...@gmail.com>:
> Casi la mitad de los senadores están ya adoptados. Cuál sería un buen
> proceso de revisión? Una nueva columna con un checker cuando el
> adoptante ya haya puesto la celda con el nombre del senador en verde?
Puede ser que con esa columna sea suficiente sí. En cualquier caso
David, ya sabes que si necesitas algo de fuerza de desarrollo para
automatizar algo en esta lista "habemus" unos cuantos XD.
--
Kind Regards,
Aitor Garcia
Pro Bono Publico - http://www.probp.org
Alguien decia en twitter que se eataban borrando cosas. Si eso desactivamos edicion anonima y exijimos estar registrado...
Sent from my iPhone
2011/9/9 David Cabo <david...@gmail.com>:
> Alguien decia en twitter que se eataban borrando cosas. Si eso desactivamos edicion anonima y exijimos estar registrado...
+1 total.
Un abrazo y enhorabuena por el proyecto
Miguel Arroyo Pérez
map...@maperon.com
600474222
-----Mensaje original-----
De: pro-bono...@googlegroups.com [mailto:pro-bono...@googlegroups.com] En nombre de Aitor Garcia Rey
Enviado el: viernes, 09 de septiembre de 2011 15:41
Para: pro-bono...@googlegroups.com
Asunto: Re: Adopta un senador
+1
A medida que este fichero se queda conocido, un troll u otro siempre llega.
Saludos
Francesco
2011/9/9 Miguel Arroyo Pérez <map...@maperon.com>:
He restaurado la versión de hace hora y media, porque alguien había
borrado las cabeceras y desordenado las cosas, era un caos.
Por lo visto recordaba mal, en Google Docs no puedes decir "cualquiera
puede editar, pero registrado", o igual me equivoco: parece que hay
que listar a los editores explícitamente. No es que sea el fin del
mundo, pero sí que introduce un elemento burocrático un poco
tocapelotas.
Sugerencias?
2011/9/9 David Cabo <david...@gmail.com>:
Que escriba un mail a esta lista presentándose?
Me he ido de cañas para pensar :)
Sent from my iPhone
si supieras hacer una regla de excel se podrian marcar rapidamente los
que hagan cosas asi.
saludos,
Mar Canet
2011/9/9 Jose del Moral <eus...@gmail.com>:
Hecho (puede que tengas que volver a abrir el fichero). He desactivado
el acceso anónimo hace un rato porque han borrado toda la excel y han
puesto spam. Cosas de salir en El País imagino. He restaurado el
fichero a una versión que parecía estar bien, pero si se me ha pasado
algo me dices. (De todas formas luego hay que revisarlo.)
> Se me ocurre que se haga un form por que ese se puede restringir a añadir
> únicamente y si alguien pone chorradas se borra la linea muy fácil.
Sí, buena idea. El problema sería entonces saber qué diputado hacer
cada uno. Lo hablamos mañana... aunque el de los senadores está casi
hecho, con unas pocas personas motivadas que pidan permiso para editar
ya se termina.
Está siendo un experimento interesante...
/david
Buenas Jose,
En lo que, espero, coincidamos, es que tras el esfuerzo colectivo de
transformar a formato "machine-readable" (si se me permite hablar en
awful inglis) será mucho más sencillo analizar de forma agregada los
datos y realizar detección de irregularidades como la que comentas.
Creo que merece la pena.
> 2011/9/9 David Cabo <david...@gmail.com>:
>> Hola a todos,
>>
>> Como sabéis hace unas horas se publicaron las declaraciones de bienes
>> de diputados y senadores, pero en PDFs que son imágenes escaneadas de
>> los formularios en papel, de los que no se pueden sacar los datos
>> automáticamente. He montado un pequeño experimento de crowdsourcing a
>> ver si entre todos conseguimos convertirlos, siguiendo el ejemplo del
>> The Guardian con las dietas de los diputados y similares. Javier de la
>> Cueva lo explica mejor que yo [1].
>>
>> Así que podéis pasaros por este documento de Google Docs [2] y
>> adoptar un senador. (La web del congreso todavía va muy mal, así que
>> empezamos por aquí a ver si funciona.)
>>
>>
>> Un saludo,
>>
>> /david
>>
>> [1]: http://derecho-internet.org/node/569
>> [2]: https://docs.google.com/spreadsheet/ccc?key=0AowzHU9kHzeudG9aSjVVOEQxVHpzR2E4ZDdhVXJLQlE&hl=en_US#gid=0
>>
>
--
J. Félix Ontañón Carmona
No sé si valdría la pena después subir el fichero a ManyEyes
(http://www-958.ibm.com/software/data/cognos/manyeyes/) o a Google
Fusion Tables (http://www.google.com/fusiontables/Home?pli=1) para ver
qué visualizaciones (y otras cosas) puede hacer la gente con esos
datos.
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
El día 11 de septiembre de 2011 18:14, Jose del Moral
<eus...@gmail.com> escribió:
> No sé si valdría la pena después subir el fichero a ManyEyes
> (http://www-958.ibm.com/software/data/cognos/manyeyes/) o a Google
> Fusion Tables (http://www.google.com/fusiontables/Home?pli=1) para ver
> qué visualizaciones (y otras cosas) puede hacer la gente con esos
> datos.
Los diputados aún no están listos, pero la hoja de senadores está
completa ya: http://bit.ly/qL9efc
Así que si alguien quiere jugar con los datos y visualizarlos, adelante!
/david