Fwd: Teclado en guaraní

159 views
Skip to first unread message

Ivan Prieto

unread,
Jun 30, 2016, 12:39:02 AM6/30/16
to Raúl Orue, Walter Emilio Gómez, giovanni...@gmail.com, tembiapo lista, CoopSoLPy, Cesar David Rodas Maldonado, Guarani Renda (Gmail), Luca Cernuzzi, Maria Elena Garcia, Nicolas Caballero
Llamado a quien pueda/quiera colaborar

Me gustaria conectarlos a Manuel Fernandez de Guaranirenda quien esta buscando textos en formato digital en guarani para montar un teclado de texto predictivo para Android.. un poco mas abajo la historia

Muchos de nosotros hemos trabajado en el tema (Raul y yo en el analizador lexico y conjugador, Giovanni y Walter en un corrector, Cesar con un sw que determinaba si una pagina estaba en guarani o no, un grupo de mozilla para traducir la interfaz del firefox, etc... )  con mayor o menor grado de exito y creo que todos nos enfrentamos a la dificultad de encontrar datos que puedan servir de base para construir herramientas mas potentes.

Bueno, esto es justamente lo que necesitan Manuel y Julien.. ingentes cantidades de texto escrito en guarani (en formato digital) para hacer que su software predictivo pueda proponer la prox palabra que vamos a escribir en un android.. no importa que el texto sea purista ni tenga todas las palabras bien escritas ya que esas cosas se van ajustando cuando agregamos volumen..

Si tienen alguna herramienta, contacto o fuente de datos que pueda ayudar a esta tarea estoy seguro que el universo se los va a agradecer

Fuerte abrazo,
Ivan.-


---------- Mensaje reenviado ----------
De: Manuel F. Fernández <man...@guaranirenda.com>
Fecha: 28 de junio de 2016, 19:46
Asunto: Re: Teclado en guaraní
Para: Iván Prieto <ivan.p...@gmail.com>


Estimado Iván:

Vaya rapidez en contestar!
Gracias, amigo!

Seguimos en contacto.
Un abrazo,
Manolo.

Ára 28/6/2016, 19:41 jave, ivan.p...@gmail.com ohai kuri:
Hola Manuel,
que bueno escuchar de uds!
bueno.. te cuento, vivo en miami hace año y medio y la verdad que ese hilo no lo segui como quisiera
Dejame buscar en mis registros y contactos para ver que podemos hacer, basicamente tenemos "en el haber" un traductor, un conjugador y un software para identificar si un texto esta o no escrito en español (y los contactos que lo hicieron realidad)... pero desconozco que exista una fuente masiva de escritos en guarani ... 
Pero me gusta el desafio... hagamos el llamado y veamos que sale, te pongo en el loop!

Abrazos,
Ivan

Sent from my iPhone

On Jun 28, 2016, at 7:31 PM, Manuel F. Fernández <man...@guaranirenda.com> wrote:

Hola, Iván:

Tal vez me recuerdes, hemos hablado antes... ya por el tema guaraní, o por la docencia de la UAA.

Esta vez quiero comentarte que hay alguien interesado en hacer un teclado predictivo en guaraní para Android. Se trata de Julien Baley, quien trabaja para Swiftkey, empresa actualmente parte de Microsoft.

Como puedes ver en los mensajes anteriores (transcriptos aquí abajo), me ha pedido ayuda para recolectar lo que pueda para un corpus del guaraní, que necesita para el proyecto. Yo recordé del trabajo a ese respecto que estaban haciendo en la UCA, y me contacté con Chema Rodríguez, quien a su vez me mencionó que vos estabas también en ese grupo de trabajo.

Entonces, te molesto esta vez para pedirte información acerca de lo que sepas de ese proyecto, o lo  los resultados del mismo --por más parciales que sean-- que puedas compartir... todo por supuesto, siempre en pos de nuestro idioma guaraní.

Cordiales saludos,
Manuel Fernández.

-------- Marandu ojerahauka jeýva --------
Mba'e: Re: Re: Teclado en guarani
Aravo: Mon, 27 Jun 2016 21:30:24 -0400
Avágui: JOSÉ MARIA RODRIGUES RODRIGUES <chema.r...@gmail.com>
Avápe: Manuel F. Fernández <man...@guaranirenda.com>

Hola Manuel,

Pues sí, amigo, también estuve a cargo de ese proyecto, pero hace mucho tiempo que lo dejé en manos del Equipo del Centro de Posgrado de la UCA y sinceramente no sé si han seguido desarrollando el sistema.

En realidad, está incompleto. En aquel entonces llegamos a producir una serie de documentación, la estructura del Corpus de Referencia de la lengua guaraní (sincrónico y diacrónico) y algunos programas de generación y extracción de información *AGN.
Llegamos incluso a generar un diccionario, un compilador para Linux y resolvimos el tema de los diacríticos.
  
El Ingeniero informático que desarrolló el corrector ortográfico, el conjugador de verbos y compilador se llama Ivan Prieto y creo que ahora vive en los Estados Unidos. Te envío su correo electrónico, por si te sirve de ayuda: ivan.p...@gmail.com

El otro informático, Raúl Orué, es un gran amigo y fue quien desarrolló el paquete informático de análisis léxico para el guaraní, que, por cierto, me permitió llevar a cabo mi proyecto de posdoctorado con el Pe. Meliá. Ahora mismo creo que él le está echando un cable a Domingo Aguilera en la SPL, donde, según me dijeron, están trabajando en el desarrollo de un Corpus de referencia también.

Dile a tu amigo que se ponga en contacto con la SPL. Estoy seguro de que les va a gustar la idea y podrán apoyarse mutuamente.

Con relación a tu pregunta, el proyecto del Julien Bailey es factible y tiene sentido desde el punto de vista de la Lingüística Computacional. De hecho, hicimos los primeros ensayos en Paraguay hace 8 años y las reglas morfosintácticas generadas (un pequeño listado) funcionaron bastante bien... pero creo que era demasiado avanzado para la época y nos quedamos ´sin fondos´ jejeje

¡Felícitalo de mi parte por la iniciativa y aliéntalo, porque se trata de un buen proyecto!

Un gran abrazo y ánimo a los dos.

Chema

El 27 de junio de 2016, 20:35, Manuel F. Fernández <man...@guaranirenda.com> escribió:
Hola, Chema

He aquí alguien que me contactó para ayudarle a desarrollar un teclado predictivo del guaraní para Android. Trabaja para Swiftkey, que ahora creo que es parte de Microsoft. (Ver texto reenviado)

Lo que quiero preguntarte es qué sabes del corpus del guaraní que se estaba preparando, creo que en la UCA, para poner a disposición pública. Quizás tú mismo estabas involucrado en el proyecto, no lo sé.

Y de paso, también me gustaría saber tu opinión al respecto de esta idea de Julien Baley.

Un abrazo,
Manolo.


-------- Marandu ojerahauka jeýva --------
Mba'e: Re: Teclado en guarani
Aravo: Fri, 24 Jun 2016 10:50:32 +0100
Avágui: Julien Baley <julien...@gmail.com>
Avápe: Guarani Renda <hai...@guaranirenda.com>


Hola Manuel,

gracias por su respuesta, no puede imaginar cuanto feliz estoy de tener esta oportunidad! Sera el primer idioma americano que haré :) Pues, aunque su inglés es claramente mejor que mi español, en vista de que no puedo escribirle en guaraní, escribiré en español.

El teclado que hacemos en Swiftkey puede predecir palabras (la palabra que esta escribiendo y igualmente la siguiente). Necesitamos "aprender" el modo de hablar de la gente y por eso necesitamos tanto mucho texto como posible. Podría ayudarme? Lo sólo que necesito es que me dé/haga una lista de sitios web que tienen testo en guaraní. Puede ser noticias, blogs, cualquier tipo de textos es bueno, la única regla es: cuanto más mejor.
Si la gente no escribe correctamente, podré corregirlo, no es un problema demasiado importante (incluso el problema de los diacríticos, esos son muy fácil de corregir y lo hacemos por todos los idiomas).

No tengo prisa, pero tengo tiempo, pues si usted tenia tiempo de crear una lista así, yo podría preparar lo demás. Oh, he olvidado: ya no puedo estar seguro de que será posible construir un modelo por el guaraní: dependerá solamente de la cantidad de testo que podemos encontrar (que si no lo escribe suficientemente la gente, no es posible aprender su modo de hablar...).

Cordiales saludos,

Julien



Libre de virus. www.avast.com


Libre de virus. www.avast.com

Raúl Orue

unread,
Jun 30, 2016, 6:12:41 PM6/30/16
to Giovanni Caligaris, CoopSoLPy, Cesar David Rodas Maldonado, Guarani Renda (Gmail), Walter Emilio Gómez, Nicolas Caballero, Ivan Prieto, Maria Elena Garcia Diaz, Luca Cernuzzi, tembiapo lista

Buenas tardes Ivan,

Que excelente proyecto! a las órdenes desde ya

Si entendí bien necesitan la mayor cantidad de textos en guaraní, no sólo palabras.

Yo estoy en proceso de finalizar mi tesis con la Ing Magalí González, por cuestiones laborales tuve que postergar la defensa final, espero retomarlo este semestre.  Consiste en un conjunto de herramientas de análisis léxico para el guaraní, parte de lo que es el proyecto AVAKOTEPA, muchos contenidos no fue posible conseguir pero las fuentes que se tenían del proyecto es lo que utilice. Actualmente estoy como analista desarrollador en el MOPC en el equipo TI de la dirección de agua potable y saneamiento.

De AVAKOTEPA se tiene un lexicon de la biblia en guaraní con más de 10mil palabras sin repetir, ahí el contacto principal seria Chema Rodrigues o bien consultar directamente en la UCA Central, postgrado de filosofía, con la Prof Dora Bobadilla.

Por otro lado, en la SPL se están digitalizando textos principalmente libros en guaraní, yo estuve trabajando con ellos en el desarrollo de lo que sería un portal para subir las obras digitalizadas, realizar búsquedas de palabras en textos y mostrar el contexto de encontrado, es la base de lo que sería el corpus del guaraní, el contacto ahí es Domingo Aguilera.

En Paraguay no hay muchas fuentes digitales, pero se que el diario abc es una alternativa, cuestión de averiguar, Domingo Aguilera tiene contactos ahí.

Por último, Recientemente se lanzó el corpus de un instituto de lengua francés llamado LANGAS ellos tienen muchos contenidos digitalizados en su plataforma, no manejo los números y no tengo contacto directo pero creo que Chema o el Padre Melia podrían ayudar en eso. Otras fuentes, sitios o contenidos no conozco.

Saludos a todos!

Raúl Orué

Hola a todos,

Yo tengo un diccionario informático que hice para LibreOffice. Tiene aproximadamente 1500 palabras. El 90% creo que vale la pena usar, el resto.... mas o menos.


Si quieren descargar, avísenme y le pregunto a LO como hago para bajar el archivo .po

También he creado el teclado Guaraní, que esta basado en el teclado español-latino. 


En la misma carpeta verán que también cree un diccionario de Sinónimos, tiene aproximadamente 1500 palabras. 

También pueden descargar mi proyecto LibreGuarani en la pagina de LibreOffice.org. Si necesitan instrucciones como instalar, me pueden preguntar. Sea para Windows o Linux.

Espero que les sirva de algo. 
Reply all
Reply to author
Forward
0 new messages