Número de significados

38 views
Skip to first unread message

mgua...@gmail.com

unread,
May 8, 2014, 5:58:28 AM5/8/14
to mcr-...@googlegroups.com
Hola,

tengo una necesidad muy específica que el WN español me puede solucionar, pero soy muy novato en esto. Me he instalado con éxito la versión sql de MCR. En concreto, lo que necesito es obtener el número de significados que tiene una palabra dada. Por ejemplo, si busco 'canto', podemos imaginar que ésta palabra tendrá el sentido del hecho de cantar (ej.: el canto es bello), el de esquina (ej. me he dado en el canto), y el de la forma conjugada del verbo cantar (ej.: yo canto). Lo que necesitaría es crear una consulta donde poniendo la palabra 'canto', me diera como resultado (en este caso concreto) un '3'. Me he esforzado en tratar de entender las tablas, campos y relaciones entre ellos existentes en MCR, pero no lo he logrado.

Cualquier ayuda sobre cómo hacer lo que necesito sería muy bienvenida, tanto si es una ayuda muy genérica acerca de cómo debería procedder, como si es muy técnica (tengo conocimientos de programación, por lo que se me puede hablar 'en código').

Muchas gracias.

Marc
---

german rigau

unread,
May 8, 2014, 7:17:52 AM5/8/14
to mcr-...@googlegroups.com
Hola Marc,

El MCR no contiene todas las variantes morfológicas (formas) de las palabras. Sólo incluye los lemas o formas canónicas.

Así, encontraremos "canto" como sustantivo (noun) o "cantar" como verbo (verb), pero no la tercera persona del singular del verbo "cantar".

Hay disponibles varias herramientas que realizan el análisis (se llama lematizació ya que de la forma pasa al lema) o generación (del lema pasa a la forma).

Saludos,

German





--
You received this message because you are subscribed to the Google Groups "MCR-users" group.
To unsubscribe from this group and stop receiving emails from it, send an email to mcr-users+...@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.

Marc Guasch Moix

unread,
May 8, 2014, 9:57:11 AM5/8/14
to mcr-...@googlegroups.com
Hola,

muchas gracias por la respuesta. De hecho ya he estado 'jugando' con freeling, y casi me da lo que necesito pero en el foro de ayuda de freeling me recomendaron que, para lo que yo quiero, era mejor coger directamente los datos de mcr. Y así es como llegué aquí. Seguiré probando con ambos a ver si lo consigo. 

Solamente una pregunta más, que puede parecer muy bàsica, pero es que no logro dar con la respuesta. Observando las distintas tablas veo que el campo 'offset' es el que permite relacionarlas entre ellas. ¿Pero dónde puedo ver a qué palabra corresponde a un offset determinado? Por ejemplo, ¿en qué tabla puedo ver qué palabra es: spa-30-00002621-r?

Gracias.



--
You received this message because you are subscribed to a topic in the Google Groups "MCR-users" group.
To unsubscribe from this topic, visit https://groups.google.com/d/topic/mcr-users/SZKbktbRcOc/unsubscribe.
To unsubscribe from this group and all its topics, send an email to mcr-users+...@googlegroups.com.

Aitor Gonzalez Agirre

unread,
May 8, 2014, 11:57:39 AM5/8/14
to mcr-...@googlegroups.com
Hola Marc,

La relación entre las palabras y el offset lo puedes encontrar en las tablas "wei_***-30_variant" donde los asteriscos representan el código de cada idioma. Como añadido, te explico como esta codificado el offset:

ccc-**-XXXXXXX-p

ccc: Codigo de 3 letras que indica el idioma.
**: Versión de WordNet (en este caso, la 3.0)
XXXXXXXX: Offset del synset.
p: Part Of Speech (PoS, n=noun, v=verb, a=adjective, r=adverb).

En tu caso el offset spa-30-00002621-r corresponde a las adverbios siguientes:

barely_1 hardly_1 just_5 scarcely_1 scarce_1 

Estas palabras en concreto no están incluidas en el MCR para el castellano, así que no los podrás encontrar en su tabla.

Un saludo,
Aitor.



Date: Thu, 8 May 2014 15:57:11 +0200
Subject: Re: [mcrr-users] Número de significados
From: mgua...@gmail.com
To: mcr-...@googlegroups.com

Hola,

muchas gracias por la respuesta. De hecho ya he estado 'jugando' con freeling, y casi me da lo que necesito pero en el foro de ayuda de freeling me recomendaron que, para lo que yo quiero, era mejor coger directamente los datos de mcr. Y así es como llegué aquí. Seguiré probando con ambos a ver si lo consigo. 

Solamente una pregunta más, que puede parecer muy bàsica, pero es que no logro dar con la respuesta. Observando las distintas tablas veo que el campo 'offset' es el que permite relacionarlas entre ellas. ¿Pero dónde puedo ver a qué palabra corresponde a un offset determinado? Por ejemplo, �=Fen qué tabla puedo ver qué palabra es: spa-30-00002621-r?

Gracias.



El 8 de mayo de 2014, 13:17, german rigau <german...@ehu.es> escribió:
Hola Marc,

El MCR no contiene todas las variantes morfológicas (formas) de las palabras. Sólo incluye los lemas o formas canónicas.

Así, encontraremos "canto" como sustantivo (noun) o "cantar" como verbo (verb), pero no la tercera persona del singular del verbo "cantar".

Hay disponibles varias herramientas que realizan el análisis (se llama lematizació ya que de la forma pasa al lema) o generación (del lema pasa a la forma).

Saludos,

German



2014-05-08 11:58 GMT+02:00 <mgua...@gmail.com>:
Hola,

tengo una necesidad muy específica que el WN español me puede solucionar, pero soy muy novato en esto. Me he instalado con éxito la versión sql de MCR. En concreto, lo que necesito es obtener el número de significados que tiene una palabra dada. Por ejemplo, si busco 'canto', podemos imaginar que ésta palabra tendrá el sentido del hecho de cantar (ej.: el canto es bello), el de esquina (ej. me he dado en el canto), y el de la forma conjugada del verbo cantar (ej.: yo canto). Lo que necesitaría es crear una consulta donde poniendo la palabra 'canto', me diera como resultado (en este caso concreto) un '3'. Me he esforzado en tratar de entender las tablas, campos y relaciones entre = ellos existentes en MCR, pero no lo he logrado.

Cualquier ayuda sobre cómo hacer lo que necesito sería muy bienvenida, tanto si es una ayuda muy genérica acerca de cómo debería procedder, como si es muy técnica (tengo conocimientos de programación, por lo que se me puede hablar 'en código').

Muchas gracias.

Marc
---


--
You received this message because you are subscribed to the Google Groups "MCR-users" group.
To unsubscribe from this group and stop receiving emails from it, send an email to mcr-users+...@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.

--
You received this message because you are subscribed to a topic in the Google Groups "MCR-users" group.
To unsubscribe from this topic, visit https://groups.google.com/d/topic/mcr-users/SZKbktbRcOc/unsubscribe.
To unsubscribe from this group and all its topics, send an email to mcr-users+...@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.

Marc Guasch Moix

unread,
May 8, 2014, 1:40:57 PM5/8/14
to mcr-...@googlegroups.com
Hola,

infinitas gracias. Esta información me ha sido de mucha utilidad y se me ha hecho la luz :) . 

Marc
---

Aitor Gonzalez Agirre

unread,
May 9, 2014, 4:19:57 AM5/9/14
to mcr-...@googlegroups.com
De nada Marc,

Si necesitas hacer consultas al MCR, también hay disponible una interfaz web:


Es bastante sencillo de usar, pero si quieres saber más siempre puedes echarle un vistazo a la Wiki:


Aitor.



Date: Thu, 8 May 2014 19:40:57 +0200

Marc Guasch Moix

unread,
May 9, 2014, 6:56:18 AM5/9/14
to mcr-...@googlegroups.com
Cierto! Había estado 'jugando' con la interfaz web, pero no me había percatado de que permite también buscar por synset. Me irá de maravilla. Gracias.

Marc
---

Reply all
Reply to author
Forward
0 new messages