Propuesta de trabajo AVAKOTEPA

12 views
Skip to first unread message

Ivan Prieto

unread,
May 25, 2009, 9:33:16 AM5/25/09
to chema.r...@gmail.com, Guillermo Sequera, Dora de Cazal (Avakopeta), euro...@gmail.com, tembiapo lista
Buenas,

El sabado hable con la Sra. Miriam Gomez (no tengo su mail, si pueden reenviarle) acerca de las posibles etapas y metas para nuestro corrector ortográfico.. quedamos hacer una reunion el lunes o martes a la tarde, asi que para prepararnos paso una propuesta preliminar

1- Grupo de trabajo/Repositorio de archivos: propongo usar un grupo ya existente que utilizamos para hacer la version Beta del corrector.

Favor unanse a este grupo y vayan subiendo los archivos que consideren interesantes alli (si no saben como, les muestro en la reunion física)
http://groups.google.com/group/tembiapo

Ya existen varios archivos y páginas + debates allí que pueden leer si tienen tiempo y que explican vagamente el proceso de construccion del corrector

2- Etapas del proceso:
a- Recoleccion de informacion digital (equipo linguistas - equipo L :D). - la mayor cantidad posible en formato digital y que este bien escrito (asi no pasamos por un proceso de correccion muy tedioso). Los materiales que accedan favor subirlo al grupo en formato texto plano.
b- Procesamiento de palabras (equipo informatico - equipo I ). Programita que va procesando los textos y saca palabras únicas y cant de ocurrencias. El resultado le pasa otra vez a equipo L para que verifique si las palabras entresacadas estan bien escritas
c- Equipo L: con el listado de palabras depuradas, van etiquetandolas para detectar las palabras raices y derivadas. Explicare el mecanismo de esto "en clase"

El flag D indica que la palabra base acepta un disminutivo con 'i (puso+i)

Asi en el diccionario encontraremos (.dic):

aguara/D
surubi/D
...

Y la regla AFF sería (.aff):

flag *D:    # sufijos para disminutivos con 'i (puso+i)
[ A E I O U ] > ' I   # todos las sustantivos terminados con vocales como aguara/aguara'i

d- Equipo I: una vez que lleguemos a la meta (5000 palabras raices + 50 reglas ) generar el corrector en el formato adecuado para el openoffice

Por lo pronto el equipo L junten TODOS los materiales que puedan.. como tenemos tiempo acotado, tenemos que hacer lo mejor posible la primera vez.

Nos vemos pronto,
Iván.-



Reply all
Reply to author
Forward
0 new messages