Como quedamos ayer, escribo para contarles del status actual del
mapa76 y por donde creo yo que deberiamos seguir.
En los momentos iniciales decidimos con Mariano Blejman que todo el
proyecto tenia que girar alrededor de las personas. Por eso es que
todo lo que anotamos es relacionado a "una persona".
Lo que marcamos son las cosas que les pasaron a las personas (que), en
que lugar les pasaron (donde), y en que momento les pasaron (cuando).
En principio, esto alcanza para marcar las cosas mas "importantes"
* lo secuestraron
* lo mataron
* tuvo un hijo
* lo liberaron
* lo torturaron
Hace agua en algunas partes, por ej, ahora no hay manera de marcar que
alguien "fue torturado por mengano". Digamos que al modelo le faltan
mas personas asociadas al "que"
* Secuestrado por Fulano y Mengano
* Da a luz a Fulanito
* Vio a Foobar
Tambien soportamos fechas inexactas (a#o sin mes ni dia, mes sin dia, etc).
Otras cosas que estan planeadas pero no estan hechas son:
* Relaciones entre personas (hijo de, madre de, jefe de)
* Atributos de las personas (militaba en ERP), Matias tiene unos
ejemplos mas complejos de esto (militaba en tal lugar, en tal fecha,
en una organizacion que dependia de otra, pero ya no, etc).
Para mi, las tareas pendientes son:
1) reformular el modelo de datos + pasar a mongo: nos faltan los
atributos de las personas, las relaciones entre ellas, y las
relaciones entre un hito y mas personas involucradas aparte de la
principal
2) seguir trabajando en la deteccion nombres mal escritos, typos (lo
que hicieron @tonchis_ y @munshkr avanza bastante, pero quizas habria
que agregar ahora el "contexto" para solucionar esto mejor).
2.1) En la interfaz se complica cuando aparece en un parrafo alguien
mencionado como "Jorge Lopez" pero despues se lo menciona como "Lopez"
3) la interfaz de carga demostro ser muy poco dinamica, en varias
horas de laburo, los periodistas solo pudieron extraer un par de
cientos de hitos
4) la parte publica todavia necesita mucho trabajo, @deimidis estaba
laburando en eso
5) toda la exploracion semantica para mi tiene un +1 mientras que sea
una capa que se agrega encima y no complica el desarrollo actual
(mapa76 r&d :)
6) creo que tiene sentido pensar en un preprocesamiento de los
documentos para hacer que nunca haga falta abrir los originales en txt
o cuando haga falta, sea lo mas eficiente posible.
Si les parece bien, continuo describiendo el modelo de datos y las
curiosidades que haya.
Estoy muy contento de tenerlos onboard!
Salud!
--
Martin Sarsale
msn: mar...@malditainternet.com
jabber: martin....@gtalk.com
twitter: http://twitter.com/runixo
linkedin: http://www.linkedin.com/in/msarsale
sumavisos: http://www.sumavisos.com
Bueno, primero que nada quería decir que fue un gusto conocerlos y laburar con todos ustedes. Mapa76 me parece una gran iniciativa y siento que es una buena oportunidad para usar mis poderes de programador para el bien.
Lo que tenía en mente hacer es continuar con el punto 2) y ver cómo agregarlo al proyecto. Todavía tengo que leer un poco el código para entenderlo mejor y, si nadie se ofende, tirarle con un poco de refactor.
1) reformular el modelo de datos + pasar a mongo: nos faltan los
atributos de las personas, las relaciones entre ellas, y las
relaciones entre un hito y mas personas involucradas aparte de la
principal
2) seguir trabajando en la deteccion nombres mal escritos, typos (lo
que hicieron @tonchis_ y @munshkr avanza bastante, pero quizas habria
que agregar ahora el "contexto" para solucionar esto mejor).
2.1) En la interfaz se complica cuando aparece en un parrafo alguien
mencionado como "Jorge Lopez" pero despues se lo menciona como "Lopez"
3) la interfaz de carga demostro ser muy poco dinamica, en varias
horas de laburo, los periodistas solo pudieron extraer un par de
cientos de hitos
4) la parte publica todavia necesita mucho trabajo, @deimidis estaba
laburando en eso
5) toda la exploracion semantica para mi tiene un +1 mientras que sea
una capa que se agrega encima y no complica el desarrollo actual
(mapa76 r&d :)
6) creo que tiene sentido pensar en un preprocesamiento de los
documentos para hacer que nunca haga falta abrir los originales en txt
o cuando haga falta, sea lo mas eficiente posible.
Si les parece bien, continuo describiendo el modelo de datos y las
curiosidades que haya.
Estoy muy contento de tenerlos onboard!
Salud!
--
Martin Sarsale
msn: mar...@malditainternet.com
jabber: martin....@gtalk.com
twitter: http://twitter.com/runixo
linkedin: http://www.linkedin.com/in/msarsale
sumavisos: http://www.sumavisos.com
Un abrazo grande
Marcos
--
Ing. Marcos Vanetta
https://launchpad.net/~marcosvanetta
http://blog.malev.com.ar
twitter: @malev