Hola a todos,
Llevamos unas semanas hablando con Open Corporates para organizar un evento de scraping de cierta información corporativa, lo que ellos llaman FlashHack, en el contexto de su proyecto Map The Banks, que busca abrir datos corporativos de empresas financieras. El primer paso es saber qué empresas tienen licencias para operar como bancos o financieras en distintos países del mundo, para más adelante intentar reconstruir su estructura de filiales y similares (como hicieron en [1]).
Aquí [2] tenéis más detalles, pero si tenéis cualquier duda aquí estoy, preguntad por aquí. De todas formas quiero escribir unas notas técnicas antes del evento sobre Turbot, la plataforma de scraping que han montado en Open Corporates, basada en Morph.io, de Open Australia. Yo aún no me he puesto en serio, pero básicamente es una plataforma para correr cientos de scrapers en Python o Ruby, y consolidar y verificar en un punto común los resultados (JSON) que produce cada uno.
El evento es el 18 de Marzo en Medialab Prado, y conectaremos con el FlashHack que tendrá lugar a la vez en Londres. Es entrada libre, y podéis venir sin más, pero si os apuntáis [3] mejor por calcular cuánta gente viene y qué perfiles tienen y tal.
Espero veros allí, un saludo,
/david
PS: Si alguien no quiere programar estamos pensando también en hacer en paralelo una mini-charla sobre la situación del registro mercantil en España, el BORME, y/o sobre decisiones recientes del gobierno británico para crear un registro de beneficiarios últimos (beneficial ownership) de las empresas.