Ayer, a raíz de una reunión con el MediaLab para buscar posibles
formas de colaboración, salió el tema de la entrega de premios. A
ellos les gustó la experiencia el año pasado, y también mucho el
BarCamp de Febrero, que sirvió para atraer gente nueva al MediaLab,
así que se ofrecen a acoger la entrega este año otra vez. A mí
personalmente me parece estupendo.
El tema de la fecha es más discutible, sé que hay división de
opiniones entre nosotros con esto. Yo intentaría que la votación
posterior no se alargara demasiado para poder aprovechar la atención
que hayamos ganado el finde del concurso. Personalmente yo daría 1/2
semanas para que los equipos hicieran toda la promoción que puedan, y
abriría entonces las votaciones durante otras 1/2 semanas. Según esto
haríamos la entrega la última semana de Mayo (Jueves 26, p. ej.) o la
primera de Junio.
¿Opiniones?
/david
Si posible, yo lo haria mas rapido, para no perder momentum:
- Votaciones desde el 14 mayo, sabado despues del evento, hasta 20 de
mayo incluido, viernes
- premios en la semana del 23 de maio.
Saludos,
Francesco
2011/3/25 David Cabo <david...@gmail.com>:
--
Francesco Cardi
Business development
fran...@lokku.com
http://es.linkedin.com/in/francescocardi
Skype: Francesco Cardi
tel: +33 (0) 970 407 432
tel: +55 (11) 3020 5687
tel: +34 665 126 422
nestoria.com.au | The easiest way to find property | blog.nestoria.com.au
nestoria.com.br | A maneira mais fácil de encontrar o seu imovel |
blog.nestoria.com.br
nestoria.de | Immobiliensuche einfach einfach | blog-nestoria.de
nestoria.es | Encuentra pisos de la manera más fácil | blog-nestoria.es
nestoria.fr | Simplifiez la recherche immobilière | blog-nestoria.fr
www.nestoria.in | The best way to find Indian Real Estate | blog-nestoria.in
nestoria.it | Trovare casa nel modo più facile | blog-nestoria.it
nestoria.co.uk | The easiest way to find property | blog.nestoria.co.uk
www.lokku.com | 82 Clerkenwell Road, EC1M 5RF, London, +44 (0) 2074908726
Aitor ha dicho en otro hilo que se abstiene. A mí ese jueves o el
anterior (26 Mayo), que también parecía estar disponible, me parece
bien, pero no retrasaría más la fecha.
¿Alguna opinión más o cerramos el 2 de Junio?
/david
Este sería un buen punto a tratar.
Josep Jordana
jos...@gmail.com
Voztelecom Partner
http://www.adslvoipempresas.com
http://pirenelab.eu
Alberto,
Suena muy interesante y encaja con AbreDatos. Quiero empezar a
recopilar este tipo de ideas en el foro, por si alguien con ganas lo
ve y decide investigar/implementar:
Anímate y cuélgalo ahí. Ahora no hay casi tráfico, pero cuando
abramos la inscripción se animará y lo verá más gente.
un saludo,
/david
Si tienes voto :)
+1 al 2
/david
Buenas a todos,
Estoy de representante vecinal en un grupo de participación de la Iniciativa Urbana (antiguo Plan Urban) en Huesca.
La gestión de los fondos FEDER y de Cohesión corresponde a la Dirección General de Fondos Comunitarios (http://www.dgfc.sgpg.meh.es/sitios/DGFC/es-ES/Paginas/inicio.aspx)
Los proyectos con sus cuantías por comunidades vienen detallados aquí: http://www.dgfc.sgpg.meh.es/sitios/DGFC/es-ES/Paginas/BeneficiariosFederCohesion.aspx
Respecto a los tiempos y la gestión os cuento lo poco que sé y nos han mal contado.
Todos los fondos se distribuyen a nivel autonómico.
La necesidad de justificación anual es autonómica, pudiéndose compensar cantidades de diferentes proyectos para completar la anual que está establecida.
Los proyectos empiezan con dos años de retraso o más bien se han acogido a la prórroga de 2 años establecida. Así que en la mayoría son 2009-2015.
Saludos,
Luis.Salu2 y muchas gracias
Bueno en este caso los PDFs son bastante/muy procesables si hiciera falta.
> Los proyectos con sus cuantías por comunidades vienen detallados aquí:
> http://www.dgfc.sgpg.meh.es/sitios/DGFC/es-ES/Paginas/BeneficiariosFederCohesion.aspx
>
> Si, esto está calro, el tema es la ejecución....
Obviamente el 99% de las empresas no quieren dejar claro donde va el
dinero y el concepto del proyecto es casi siempre el nombre de la
Empresa o Entidad. Poco se puede hacer a nivel informatico ahí.
Me gustaria oir ideas sobre como presionar como Pro Bono Publico a
nivel mediatico en este punto. En cualquier caso llegado el momento me
puede parecer muy interesante abrir esa información por comunidades en
una aplicación, y aunque yo posiblemente me meta con otro tema si
finalmente participo en el AbreDatos como decia David me parece una
muy buena app.
--
Kind Regards,
Aitor Garcia
Pro Bono Publico - http://www.probp.org
2011/3/31 alberto <alberto...@gmail.com>:
> Lo que admiro a la gente que ve sencillo procesar los pdf, a mi me parecen
> unos tochos imparseables, si esa palabra existe.
Hombre yo lo veo sencillo -o no, que depende mucho del PDF- porque lo
he tenido que hacer cientos veces y uno coge mañas.
Ejemplo hecho en 30 secs. con el PDF del Pais Vasco:
Herramienta: $ java -jar pdfbox-app-1.5.0.jar ExtractText EU13.pdf
Parseo inicial: https://gist.github.com/897176
Ejemplo una pagina concreta (Pág. 123):
PDF Original: https://img.skitch.com/20110331-d4wiu8u753ca2hfyt3a3q3j8b4.jpg
Texto parseo inicial: https://gist.github.com/897188
Obviamente hay que re-parsear esa salida para darle estructura, pero
eso puede llevar como mucho un par de horas. Vamos que como decia en
este caso los PDFs son muyyy parseables.
--
Kind Regards,
Aitor Garcia
Simple registration for your events - http://www.stagehq.com
Founder Linking Paths - http://www.linkingpaths.com
Si, bueno, pdfminer viene con un comando pdf2txt.py para el que no
quiera/pueda instalar java con igual de "buenos" resultados. Pero eso
no quita para que sea más fácil procesar el gist de tu parseo en json
que parsear el pdf:
http://query.yahooapis.com/v1/public/yql?q=select%20*%20from%20github.gist.content%20where%20repo%3D'897188'&format=json&env=store%3A%2F%2Fdatatables.org%2Falltableswithkeys&callback=
Saludos:
Javi
Yo me he peleado también con muchos PDFs, y como dice Aitor estos no
parecen complicados, al menos esta parte.
Si alguien se va a poner con esto (yo ahora no puedo, pero no lo
descarto en el futuro) yo recomiendo usar xpdf [1], que tiene una
opción para conservar el formato de las tablas, lo cual ayuda
enormemente. La misma página que indica Aitor (la 125 del país vasco),
al usar:
$ pdftotext -f 125 -l 125 -enc UTF-8 -layout EU13.pdf
queda así: https://gist.github.com/897328
Piece of cake ;)
/david
2011/3/31 David Cabo <david...@gmail.com>:
> Si alguien se va a poner con esto (yo ahora no puedo, pero no lo
> descarto en el futuro) yo recomiendo usar xpdf [1], que tiene una
> opción para conservar el formato de las tablas
Sipe, hay cientos de librerías para hacer ese parseo, y el resultado
es procesable de manera trivial en cualquiera de ellas, como los
últimos mails demuestran... ¡veremos si alguien decide dedicarle las
pocas horas que hacen falta para convertirlo en algo presentable!.
2011/4/1 mar cabra valero <marcabr...@hotmail.com>:
> Yo es que claro, no estoy siguiendo ni la mitad de lo que decís... y sé que
> lo guay sería procesar los PDFs... pero ya que el Financial Times ha hecho
> ese trabajo en el proyecto que apuntaba antes, les escribiría, lo mismo os
> dan los datos para España...
Siento si la imagen que he/mos dado es que como somos desarrolladores
"lo guay sería procesar los PDFs", pero en cualquier caso creo que
todos tenemos claro que lo menos interesante con diferencia de todo lo
que rodea a OpenData es la programación en si misma.
Dicho esto, me gustaría hacer notar que aunque no dudo que el FT haya
hecho un trabajo ingente parece que éste no ha sido o muy completo o
muy riguroso o muy actualizado (o todo ello a la vez). Un ejemplo:
€8,379
En nuestra pequeña prueba de ayer con se podia ver que son +70.000
euros, vamos que el desfase con los datos del FT no es de redondeo por
centimos precisamente. Adicionalmente el enlace "data source" que
proporcionan no funciona porque las URLs cambiaron y no las han
actualizado.
Como bien dices MOLARIA que alguien se metiera con el tema pero que me
temo que al menos a David y a mi, por mucho que nos guste nos es
imposible en este momento por el resto de tareas en las que ya estamos
metidos.
--
Kind Regards,
Aitor Garcia
Mar
>> Dicho esto, me gustaría hacer notar que aunque no dudo que el FT haya
>> hecho un trabajo ingente parece que éste no ha sido o muy completo o
>> muy riguroso o muy actualizado (o todo ello a la vez).
>
> Pues tienes razón... Lo cual me extraña, porque la verdad que respeto
> bastante a los periodistas que lo han hecho y la institución que está
> detrás. Yo creo que o bien es un error en la búsqueda de la base de datos (a
> mi tu búsqueda si la intento yo ni me sale) o bien no han procesado esos
> datos (no me salen ninguno de los que tú sacabas en el PDF que trataste) -
> con lo cual efectivamente, la base de datos sería incompleta. Si tengo un
> hueco intentaré averiguar... por curiosidad.
La discrepancia se debe a que los datos del FT llegan hasta el 2008,
y los PDFs que tenemos nosotros llegan hasta el 2010. He buscado el
"codesyntax" que mencionaba Aitor, y las "cisternas agrupadas", así al
azar, y los números coinciden con nuestros datos para el 2008 [1]. Los
enlaces del FT están rotos, eso sí.
La verdad es que me parece un tema muy interesante, y la prueba es la
cantidad de correos sobre el tema. Cuando tenga un momento me pongo
con esto, bien para el AbreDatos, bien para hablar después con el
FT/BIJ, aunque no sé si siguen con el tema.
> En ese sentido -- El País saca una noticia que va en la línea de esto:
> http://www.elpais.com/articulo/sociedad/Ciencia/dejo/gastar/euros/presupuesto/elpepisoc/20110402elpepisoc_3/Tes
> -- en este sentido, David: estos informes de evaluación presupuestaria, no
> te servirían a ti para el "problema" que tenías con el proyecto de los
> impuestos? Es decir - para ver el gasto real (vale, que sería un poco
> infierno...).
El País debe de estar sacando los datos de los informes de la
Intervención General del Estado [2], que cada mes publica estadísticas
sobre el porcentaje de "obligaciones reconocidas" y pagos por cada
ministerio. No baja al mismo nivel de detalle que los presupuestos, se
queda en los ministerios más o menos, pero es interesante, ya lo tenía
en la lista de cosas por hacer. No es la solución definitiva, porque
no te dice cómo se gasta el dinero realmente, sólo cuánto se ha
gastado, y además nunca superan el 100% proyectado para cada partida.
(Imagino que usaran fondos de reserva genéricos si falta dinero, o
modificarán el presupuesto original, pero no sé cómo va esto.)
/david
[1]: https://gist.github.com/897328
[2]: http://www.igae.pap.meh.es/sitios/igae/es-ES/ClnEjecucionPresupuesto/Paginas/MenuSitio.aspx
> La verdad es que me parece un tema muy interesante, y la prueba es la
> cantidad de correos sobre el tema. Cuando tenga un momento me pongo
He echado la mañana escribiendo un pequeño parser [1] para los PDFs
del FEDER. He subido el resultado de parsear todos los programas (que
incluyen tanto los autonómicos como los nacionales) en un CSV aquí
[2]. El formato es bastante obvio, pero cualquier duda me decís.
Hay 88K+ entradas. La columna de "concesiones" suma 33.600 millones,
la de "pagado" 9.700 millones. No entiendo por qué hay columnas de
pagos a cero: ¿quiere eso decir que no se ha ejecutado el proyecto? Si
alguien puede aportar luz sobre esto...
Limitaciones de los datos extraídos:
- faltan 6000 euros de dos operaciones, que vienen mal formateadas y
me da pereza arreglar. :) Puede que haya algún error más, pero he
cogido una CCAA al azar, Melilla, y los números totales coincidían.
- hay descripciones de proyectos que ocupan más de una línea, y sólo
se está leyendo la primera. Se puede arreglar, con un poco de tiempo,
pero de momento arrancamos con esto.
> con esto, bien para el AbreDatos, bien para hablar después con el
> FT/BIJ, aunque no sé si siguen con el tema.
Mar, ¿merece la pena mencionarles esto al FT/BIJ y ver si siguen con
el proyecto, les interesan los datos y/o están mirando otras cosas
similares?
un saludo,
/david
[1]: https://github.com/dcabo/feder
[2]: https://github.com/downloads/dcabo/feder/feder.csv.zip
Josep Jordana
jos...@gmail.com
http://pirenelab.eu
El día 6 de abril de 2011 19:29, alberto
<albert...@libroblanco.com> escribió:
A ver, si la fuente es el BOE no hay problema, pero según para que fines, volvemos al problema de las fuentes accesibles al público en materia de protección de datos, pero no habría problema para su publicación en un medio de comunicación para una noticia.
Si lo que queremos es reutilizar, entendiéndose según la Ley de reutilización con fines comerciales, etc. debemos atenernos a lo que se establece en la licencia, o en su caso solicitando autorización, etc.
Alberto, llegaste a preguntar sobre si se pueden reutilizar los datos
del FEDER? Te contestaron?