Ivan Prieto
unread,May 25, 2009, 9:33:16 AM5/25/09Sign in to reply to author
Sign in to forward
You do not have permission to delete messages in this group
Either email addresses are anonymous for this group or you need the view member email addresses permission to view the original message
to chema.r...@gmail.com, Guillermo Sequera, Dora de Cazal (Avakopeta), euro...@gmail.com, tembiapo lista
Buenas,
El sabado hable con la Sra. Miriam Gomez (no tengo su mail, si pueden reenviarle) acerca de las posibles etapas y metas para nuestro corrector ortográfico.. quedamos hacer una reunion el lunes o martes a la tarde, asi que para prepararnos paso una propuesta preliminar
1- Grupo de trabajo/Repositorio de archivos: propongo usar un grupo ya existente que utilizamos para hacer la version Beta del corrector.
Favor unanse a este grupo y vayan subiendo los archivos que consideren interesantes alli (si no saben como, les muestro en la reunion física)
http://groups.google.com/group/tembiapo
Ya existen varios archivos y páginas + debates allí que pueden leer si tienen tiempo y que explican vagamente el proceso de construccion del corrector
2- Etapas del proceso:a- Recoleccion de informacion digital (equipo linguistas - equipo L :D). - la mayor cantidad posible en formato digital y que este bien escrito (asi no pasamos por un proceso de correccion muy tedioso). Los materiales que accedan favor subirlo al grupo en formato texto plano.
b- Procesamiento de palabras (equipo informatico - equipo I ). Programita que va procesando los textos y saca palabras únicas y cant de ocurrencias. El resultado le pasa otra vez a equipo L para que verifique si las palabras entresacadas estan bien escritas
c- Equipo L: con el listado de palabras depuradas, van etiquetandolas para detectar las palabras raices y derivadas. Explicare el mecanismo de esto "en clase"
El flag D indica que la palabra base acepta un disminutivo con 'i (puso+i)
Asi en el diccionario encontraremos (.dic):
aguara/D
surubi/D
...
Y la regla AFF sería (.aff):
flag *D: # sufijos para disminutivos con 'i (puso+i)
[ A E I O U ] > ' I # todos las sustantivos terminados con vocales como aguara/aguara'i
d- Equipo I: una vez que lleguemos a la meta (5000 palabras raices + 50 reglas ) generar el corrector en el formato adecuado para el openoffice
Por lo pronto el equipo L junten TODOS los materiales que puedan.. como tenemos tiempo acotado, tenemos que hacer lo mejor posible la primera vez.
Nos vemos pronto,
Iván.-