0) Hay varios equipos haciendo proyectos mas o menos similares, con
mas o menos puntos de contacto. Los que conocemos son:
* El de la Asociacion Nunca Mas + Gabriel Acquistapace (drupal, puede
describirlo en un reply, si así lo desea :)
* El que trabaja Matías (describa!)
* El de RED Federal de Sitios de Memoria
Creemos que estaría bueno conseguir una breve descripción de cada uno,
el modelo de datos, ver que podemos cruzar de c/u
1) Luis propuso partir el problema de la identificación de personas,
lugares e hitos en un documento en partes mas pequeñas; en vez de
trabajar con el doc entero, trabajar con los parrafos, pequeños
workers que hagan cosas simples sobre el input que les tocó y le pasen
la tarea al próximo.
Un ejemplo sería "expandir" referencias, por ejemplo:
"Se acusa a Juan Perez (de aqui en adelante 'El Acusado') de [...]. El
Acusado secuestró a [...]"
expandiría las ocurrencias de "El Acusado" en "Juan Perez"
etc
2) Modelo / Base de datos. Por algunos features que deseábamos, Luis
encontró que CouchDB parece ser un mejor candidato para nuestro
data-store que Mongo.
Durante el skype pensamos que couch tenía autoversionado de docs, pero
googlenado un poco encontré que no es taaan automático. Acá hay una
implementación del versionado
http://jchrisa.net/drl/_design/sofa/_list/post/post-page?startkey=%5B%22Versioning-docs-in-CouchDB%22%5D
Un feature que si es interesante de Couch es que hace replicación
bidireccional (y la solución automática de conflictos) y eso podría
usarse para las instalaciones "aisladas" de la aplicación, cuando por
cuestiones legales los docs sobre los que trabajan no pueden ser
públicos, pero les interesa beneficiarse de los datos que si son
públicos.
Acá hay un mongo vs couch (por la gente de mongo)
http://www.mongodb.org/display/DOCS/Comparing+Mongo+DB+and+Couch+DB
Unos amigos trabajan con CouchDB haciendo UbuntuONE y se ofrecieron a
aclararnos dudas y aconsejarnos. Viene un skype próximamente
3) De acá también surgió la pregunta sobre que tan privados son los
documentos privados?
Son tan privados que no pueden salir de la oficina donde están? O son
privados porque están protegidos con un user+passwd?
Pensamos que si eran taaaaaaaaan privados que no se podían sacar
podíamos hacer una especie de Virtual Appliance (
http://en.wikipedia.org/wiki/Virtual_appliance ) con todo lo necesario
para correr.
creo que no me olvido de nada.
Salud!
--
Martin Sarsale
msn: mar...@malditainternet.com
jabber: martin....@gtalk.com
twitter: http://twitter.com/runixo
linkedin: http://www.linkedin.com/in/msarsale
sumavisos: http://www.sumavisos.com
Estimad@s, les escribo para relatarles brevemente de la reunión de hoy
y como vamos a seguir.
0) Hay varios equipos haciendo proyectos mas o menos similares, con
mas o menos puntos de contacto. Los que conocemos son:
* El de la Asociacion Nunca Mas + Gabriel Acquistapace (drupal, puede
describirlo en un reply, si así lo desea :)
* El que trabaja Matías (describa!)
* El de RED Federal de Sitios de Memoria
Creemos que estaría bueno conseguir una breve descripción de cada uno,
el modelo de datos, ver que podemos cruzar de c/u
1) Luis propuso partir el problema de la identificación de personas,
lugares e hitos en un documento en partes mas pequeñas; en vez de
trabajar con el doc entero, trabajar con los parrafos, pequeños
workers que hagan cosas simples sobre el input que les tocó y le pasen
la tarea al próximo.
Un ejemplo sería "expandir" referencias, por ejemplo:
"Se acusa a Juan Perez (de aqui en adelante 'El Acusado') de [...]. El
Acusado secuestró a [...]"
expandiría las ocurrencias de "El Acusado" en "Juan Perez"
etc
2) Modelo / Base de datos. Por algunos features que deseábamos, Luis
encontró que CouchDB parece ser un mejor candidato para nuestro
data-store que Mongo.
Durante el skype pensamos que couch tenía autoversionado de docs, pero
googlenado un poco encontré que no es taaan automático. Acá hay una
implementación del versionado
http://jchrisa.net/drl/_design/sofa/_list/post/post-page?startkey=%5B%22Versioning-docs-in-CouchDB%22%5D
Un feature que si es interesante de Couch es que hace replicación
bidireccional (y la solución automática de conflictos) y eso podría
usarse para las instalaciones "aisladas" de la aplicación, cuando por
cuestiones legales los docs sobre los que trabajan no pueden ser
públicos, pero les interesa beneficiarse de los datos que si son
públicos.
Acá hay un mongo vs couch (por la gente de mongo)
http://www.mongodb.org/display/DOCS/Comparing+Mongo+DB+and+Couch+DB
Unos amigos trabajan con CouchDB haciendo UbuntuONE y se ofrecieron a
aclararnos dudas y aconsejarnos. Viene un skype próximamente
3) De acá también surgió la pregunta sobre que tan privados son los
documentos privados?
Son tan privados que no pueden salir de la oficina donde están? O son
privados porque están protegidos con un user+passwd?
Pensamos que si eran taaaaaaaaan privados que no se podían sacar
podíamos hacer una especie de Virtual Appliance (
http://en.wikipedia.org/wiki/Virtual_appliance ) con todo lo necesario
para correr.
creo que no me olvido de nada.
Salud!
--
Martin Sarsale
msn: mar...@malditainternet.com
jabber: martin....@gtalk.com
twitter: http://twitter.com/runixo
linkedin: http://www.linkedin.com/in/msarsale
sumavisos: http://www.sumavisos.com