Re: Helpo bezonata pri Apertium-eo-en

14 views
Skip to first unread message

Jacob Nordfalk

unread,
Mar 12, 2014, 6:13:08 AM3/12/14
to Darshak Parikh, apert...@googlegroups.com, Hèctor Alòs Font
Salon Darshak,

Mi tre ĝojas pro via intereso pri eo-en (kiun mi ne mem havis tempon por mem plibonigi dum jaroj).


echo "Thank you very much, and congratulations, your contribution seems to work fine. Good evening. Jacob. " | apertium -d . en-eo
Multan dankon kaj gratulon, via kontribuaĵo ŝajnas labori bone. Bonan vesperon. Jakobo. 

Vi skribas 'Ĉi tiu estas la problemo: Antaŭe, la vortaro konsistis nur unu formo de la vorto "thanks" — la verbo ("Fred thanks George."). Mi aldonis la substantiva formo ("Accept my thanks.") kaj la interjekcia formo ("Thanks, pal!").'

$ echo "Fred thanks George. " | apertium -d . en-eo
Fred dankas Georgon. 

Ŝajnas bona, kio estas la problemo?

$ echo "thank you very much for your contribution" | apertium -d . en-eo
multan dankon por via kontribuaĵo


Ah jen:
$ echo "Accept my thanks." | apertium -d . en-eo
Akceptas miajn dankojn.

La problemo estas ke 'Accept' povas esti kaj akceptU, akceptI kaj akceptAS.
Ĉar plejofte la ĝusta estas akceptAS la t.n. 'tagger' elektas tiun formon.

Se vi rigardas vi povas vidi ke la angla vortaro tute ne enhavas la -U-formon (<imp>):

<pardef n="accept__vblex">
<!--
<e>                           <p><l></l>                    <r><s n="vblex"/><s n="imp"/></r></p></e>
-->
  <e>       <p><l></l>          <r><s n="vblex"/><s n="inf"/></r></p></e>
  <e>       <p><l></l>          <r><s n="vblex"/><s n="pres"/></r></p></e>
  <e>       <p><l>s</l>         <r><s n="vblex"/><s n="pres"/><s n="p3"/><s n="sg"/></r></p></e>
  <e>       <p><l>ed</l>        <r><s n="vblex"/><s n="past"/></r></p></e>
  <e>       <p><l>ed</l>        <r><s n="vblex"/><s n="pp"/></r></p></e>
  <e>       <p><l>ing</l>       <r><s n="vblex"/><s n="ger"/></r></p></e>
</pardef>

Provu enmeti ĝin, sed tiam vi havus problemojn tiuj 99% de la lokoj kie -U-formo ne estas la ĝusta solvo.

Por rapide ripari vi faru ankoraŭ IJ
 <e lm="accept my thanks">   <i>accept<b/>my<b/>thanks</i><par n="hello__ij"/></e>

Pli profunda riparo postulas ke vi plibonigas la 'tagger', tio postulas pli da laboro.... se vi diligente laboras eble vi povus partopreni la GSOC (https://developers.google.com/open-source/soc/) kaj gajni monon prilaborante eo-en.


Kore,
Jacob




2014-03-12 8:32 GMT+01:00 Darshak Parikh <dar...@openmailbox.org>:
<pre>Halo Jacob!

Mi estas Darshak Parikh, nova esperantisto, kaj mi volas kontribui al la lingvoparo esperanto-angla de Apertium.

Mi elŝutis la paron el la trunko, kaj jam aldonis kelkajn novajn vortojn al mia loka kopio.

Ĉi tiu estas la problemo: Antaŭe, la vortaro konsistis nur unu formo de la vorto "thanks" — la verbo ("Fred thanks George."). Mi aldonis la substantiva formo ("Accept my thanks.") kaj la interjekcia formo ("Thanks, pal!").</pre>

Jen viaj ŝanĝoj:



$ diff ~/Hent/apertium-eo-en.en.dix apertium-eo-en.en.dix 
24713d24712
< <e lm="thanks">          <i>thanks</i><par n="personnel__n"/></e>
27818,27820d27816
< <e lm="congrats">        <i>congrats</i><par n="hello__ij"/></e>
< <e lm="congratulations"> <i>congratulations</i><par n="hello__ij"/></e>
< <e lm="good day">        <i>good<b/>day</i><par n="hello__ij"/></e>
27822,27824d27817
< <e lm="good afternoon">  <i>good<b/>afternoon</i><par n="hello__ij"/></e>
< <e lm="good evening">    <i>good<b/>evening</i><par n="hello__ij"/></e>
< <e lm="good night">      <i>good<b/>night</i><par n="hello__ij"/></e>
27830,27835d27822
< <e lm="thank you">       <i>thank<b/>you</i><par n="hello__ij"/></e>
< <e lm="thanks">          <i>thanks</i><par n="hello__ij"/></e>
< <e lm="thank you very much">   <i>thank<b/>you<b/>very<b/>much</i><par n="hello__ij"/></e>
< <e lm="thanks a lot">    <i>thanks<b/>a<b/>lot</i><par n="hello__ij"/></e>
< <e lm="thanks a ton">    <i>thanks<b/>a<b/>ton</i><par n="hello__ij"/></e>
< <e lm="you are welcome"> <i>you<b/>are<b/>welcome</i><par n="hello__ij"/></e>


$ diff ~/Hent/apertium-eo-en.eo-en.dix apertium-eo-en.eo-en.dix 
780d779
< <e>       <p><l>bonan<b/>tagon<s n="ij"/></l>          <r>good<b/>day<s n="ij"/></r></p></e>
782,784d780
< <e>       <p><l>bonan<b/>posttagmezon<s n="ij"/></l>   <r>good<b/>afternoon<s n="ij"/></r></p></e>
< <e>       <p><l>bonan<b/>vesperon<s n="ij"/></l>       <r>good<b/>evening<s n="ij"/></r></p></e>
< <e>       <p><l>bonan<b/>nokton<s n="ij"/></l>         <r>good<b/>night<s n="ij"/></r></p></e>
788,796c784
< <e>       <p><l>gratulon<s n="ij"/></l>                <r>congratulations<s n="ij"/></r></p></e>
< <e r="RL"><p><l>gratulon<s n="ij"/></l>                <r>congrats<s n="ij"/></r></p></e>
< <e>       <p><l>dankon<s n="ij"/></l>                  <r>thank<b/>you<s n="ij"/></r></p></e>
< <e r="RL"><p><l>dankon<s n="ij"/></l>                  <r>thanks<s n="ij"/></r></p></e>
< <e>       <p><l>multan<b/>dankon<s n="ij"/></l>        <r>thank<b/>you<b/>very<b/>much<s n="ij"/></r></p></e>
< <e r="RL"><p><l>multan<b/>dankon<s n="ij"/></l>        <r>thanks<b/>a<b/>lot<s n="ij"/></r></p></e>
< <e r="RL"><p><l>multan<b/>dankon<s n="ij"/></l>        <r>thanks<b/>a<b/>ton<s n="ij"/></r></p></e>
< <e>       <p><l>nedankinde<s n="ij"/></l>              <r>you<b/>are<b/>welcome<s n="ij"/></r></p></e>
< <!-- TODO: 'nedankinde' may also be used as an adverb: 'not worthy of thanks' -->
---
14717,14719c14705
< <e>       <p><l>danko<s n="n"/></l>                    <r>thanks<s n="n"/></r></p></e>
< <e>       <p><l>danki<s n="vblex"/></l>                <r>thank<s n="vblex"/></r></p></e>
< <e r="LR"><p><l>dankoni<s n="vblex"/></l>              <r>thank<s n="vblex"/></r></p></e>
---
> <e>       <p><l>dankoni<s n="vblex"/></l>              <r>thank<s n="vblex"/></r></p></e>
16916a16903
> <e r="LR"><p><l>danki<s n="vblex"/></l>                <r>thank<s n="vblex"/></r></p></e>
27478c27465
< <e r="RL"><p><l>kafejo<s n="n"/></l>                   <r>cafeteria<s n="n"/></r></p></e>
---
> <e r="RL"><p><l>kafeterio<s n="n"/></l>                <r>cafeteria<s n="n"/></r></p></e>



$ diff ~/Hent/apertium-eo-en.eo.dix.xml apertium-eo-en.eo.dix.xml 
982,983d981
986,989d983
< <e lm="gratulon">        <i>gratulon</i><par n="adiós__ij"/></e>
< <e lm="dankon">          <i>dankon</i><par n="adiós__ij"/></e>
< <e lm="multan dankon">   <i>multan<b/>dankon</i><par n="adiós__ij"/></e>
< <e lm="nedankinde">      <i>nedankinde</i><par n="adiós__ij"/></e>
992d985
< <e lm="bonan tagon">     <i>bonan<b/>tagon</i><par n="adiós__ij"/></e>
994,997d986
< <e lm="bonan posttagmezon">   <i>bonan<b/>posttagmezon</i><par n="adiós__ij"/></e>
< <e lm="bonan vesperon">  <i>bonan<b/>vesperon</i><par n="adiós__ij"/></e>
< <e lm="bonan nokton">    <i>bonan<b/>nokton</i><par n="adiós__ij"/></e>
2722d2710
< <e lm="danko">           <i>dank</i><par n="o__n"/></e>


--
Jacob Nordfalk
Androidudvikler og -underviser på DTU og Lund&Bendsen

Hèctor Alòs i Font

unread,
Mar 13, 2014, 8:44:43 AM3/13/14
to Jacob Nordfalk, Darshak Parikh, apertium_eo
Bonvenon, Darshak. Mi nuntempe ne tempas por partopreni en la retbabilejo, sed se vi havas demandojn, mi volonte provos respondi per retpoŝto. Eventuale, retbabilado je interkonsentita tempo eblas por mi. Mi tre ĝojus, se vi sukcesus akiri la projekton kaj, espereble, somere mi pli liberos por helpi.
Hektor

Darshak Parikh

unread,
Mar 13, 2014, 1:56:23 PM3/13/14
to apert...@googlegroups.com, Jacob Nordfalk, Darshak Parikh
Saluton Hektor!

Multan dankon. Se mi havas demandojn, mi demandos en ĉi tiu Google-grupo, por ke vi aŭ Jacob aŭ iu ajn alia povas vidi ĝin. Kaj se estus bezona, ni povus retbabili post decidi la tempo. Bone?

Parenteze, kiu horzone loĝas vi? (Mi loĝas en Barato, UTC+0530.)

Hèctor Alòs i Font

unread,
Mar 14, 2014, 1:14:45 AM3/14/14
to apertium_eo
Saluton, Darshak. Mi loĝas en Rusio en la Moskva horzono (UTC+04:00). Ne malfacilos trovi tempon konvenan al ambaŭ, ŝajne :)


--
You received this message because you are subscribed to the Google Groups "Apertium Esperanto" group.
To unsubscribe from this group and stop receiving emails from it, send an email to apertium_eo...@googlegroups.com.
To post to this group, send email to apert...@googlegroups.com.
Visit this group at http://groups.google.com/group/apertium_eo.
For more options, visit https://groups.google.com/d/optout.

Darshak

unread,
Mar 14, 2014, 2:47:50 AM3/14/14
to apert...@googlegroups.com
Jes ja! :D
--
Merlin was a Slytherin as well.

Jacob Nordfalk

unread,
Mar 22, 2014, 11:52:33 AM3/22/14
to apert...@googlegroups.com, Hèctor Alòs Font, fty...@dlsi.ua.es, Francis Tyers
Saluton Darshak,

Mi vidis ke vi skribis proponon
tre bone!

Kaj... mi vidas ke vi jam kontribuas al eo-en - ekzemple http://sourceforge.net/p/apertium/svn/50875/   :-)
Ĉu vi kontrolas viajn kontrobuojn per traduko de korpuso antaŭ kaj post viaj ŝanĝoj?
Mi uzis testcorpus_en-eo.sh por tio .

Pri GSoC, ŝajnas ke estas 62 studentoj kiuj proponis sin, .... kaj kutime ni ricevos ĉ 8-9 stipendiojn.
La mentoroj voĉdonos inter si kaj elektos tiujn kiujn ili plej kredas en. 

Ĉu via plano estas fari

Tio grandigus viajn ŝancojn.  Certe mi kaj Hector subtenos/ laŭ niaj kapabloj kaj tempo.

Unu el la grandaj bariloj kontraŭ plibonigo estas la 'tagger'. 

Mi kaj Francis diskutis la eblecon plibonigi la anglan senambiguilon, pere de i.a. https://svn.code.sf.net/p/apertium/svn/languages/apertium-eng/texts ... multaj aliaj paroj povus profiti de tio, kaj tio pligrandigus la ŝancojn ke vi kaj via projekto estos elektota. 


Kore,
Jacob

Hèctor Alòs i Font

unread,
Mar 22, 2014, 1:09:17 PM3/22/14
to Jacob Nordfalk, apertium_eo, fty...@dlsi.ua.es, Francis Tyers
Saluton Jacob (kaj Darshak)!

2014-03-22 19:52 GMT+04:00 Jacob Nordfalk <jacob.n...@gmail.com>:
Saluton Darshak,

Mi vidis ke vi skribis proponon
tre bone!

Kaj... mi vidas ke vi jam kontribuas al eo-en - ekzemple http://sourceforge.net/p/apertium/svn/50875/   :-)
Ĉu vi kontrolas viajn kontrobuojn per traduko de korpuso antaŭ kaj post viaj ŝanĝoj?
Mi uzis testcorpus_en-eo.sh por tio .

Jes, grava atentigo. Mi ankoraŭ ne paroli kun Darshak pri tio (mi ne certis, ĉu vi, Jacob, faris).
 

Pri GSoC, ŝajnas ke estas 62 studentoj kiuj proponis sin, .... kaj kutime ni ricevos ĉ 8-9 stipendiojn.
La mentoroj voĉdonos inter si kaj elektos tiujn kiujn ili plej kredas en. 

62!! Tio estas preskaŭ trioble ol pasintjare, mi kredas. Aliflanke, mi kredas, ke ni ricevis 10-11 en la lastaj jaroj. Ni esperu ankaŭ je iom pliaj stipendioj, se la kandidatoj tiel draste plimultiĝis.

Pri tio mi diskutis kun Darshak. Estas nevenkeblaj konkurencantoj ĉi-jare (kiel Jonathan kaj Ilnar) kaj tre interesaj proponoj, tamen, sincere, Darshak impresis al mi kiel serioza kaj fidinda kandidato. Mi iom helpis lin poluri aferojn, sed li ĉion memstare esploris kaj faris tute bonan proponon.
 

Ĉu via plano estas fari

Tio grandigus viajn ŝancojn.  Certe mi kaj Hector subtenos/ laŭ niaj kapabloj kaj tempo.

Jes, tiel Darshak faris.
 

Unu el la grandaj bariloj kontraŭ plibonigo estas la 'tagger'. 

Mi kaj Francis diskutis la eblecon plibonigi la anglan senambiguilon, pere de i.a. https://svn.code.sf.net/p/apertium/svn/languages/apertium-eng/texts ... multaj aliaj paroj povus profiti de tio, kaj tio pligrandigus la ŝancojn ke vi kaj via projekto estos elektota.

Jes, tio estas grava problemo por ĉiu tradukilo el la angla (kaj tiaj lingvoj, ni diru, "izolemaj", t.e. kun malmulta fleksio). Interalie, malfacilas distingi verbon de nomo, kaj tio, al kio rilatas adjektivo, ofte malklaras. Mi kredas, ke por tio plej produktiva estas la uzado de Constraint Grammar, kiu donis al mi bonajn rezultojn por la latinidaj lingvoj. Ĉu vi proponas uzi mane senambiguigitan tekstaron por trejni la senambiguilon?
 
Kore,
Hektor

Darshak

unread,
Mar 23, 2014, 3:51:37 AM3/23/14
to apert...@googlegroups.com


Saluton Jacob kaj Hektor!

On March 22, 2014 10:39:17 PM GMT+05:30, "Hèctor Alòs i Font" <hecto...@gmail.com> wrote:
>Saluton Jacob (kaj Darshak)!
>
>2014-03-22 19:52 GMT+04:00 Jacob Nordfalk <jacob.n...@gmail.com>:
>
>> Saluton Darshak,
>>
>> Mi vidis ke vi skribis proponon
>>
>>
>http://www.google-melange.com/gsoc/proposal/review/org/google/gsoc2014/darshak/5668600916475904
>> tre bone!
>>
>> Kaj... mi vidas ke vi jam kontribuas al eo-en - ekzemple
>> http://sourceforge.net/p/apertium/svn/50875/ :-)
>> Ĉu vi kontrolas viajn kontrobuojn per traduko de korpuso antaŭ kaj
>post
>> viaj ŝanĝoj?
>> Mi uzis testcorpus_en-eo.sh por tio .
>>
>
>Jes, grava atentigo. Mi ankoraŭ ne paroli kun Darshak pri tio (mi ne
>certis, ĉu vi, Jacob, faris).
>
Ha, ne, mi neniam pripensis gxin, sed jes, estus pli prudenta fari gxin.
>> multaj aliaj paroj povus profiti de tio, kaj tio pligrandigus la
>ŝancojn ke
>> vi kaj via projekto estos elektota.
>>
>
Mi devas lookup gxin.
>Jes, tio estas grava problemo por ĉiu tradukilo el la angla (kaj tiaj
>lingvoj, ni diru, "izolemaj", t.e. kun malmulta fleksio). Interalie,
>malfacilas distingi verbon de nomo, kaj tio, al kio rilatas adjektivo,
>ofte
>malklaras. Mi kredas, ke por tio plej produktiva estas la uzado de
>Constraint Grammar, kiu donis al mi bonajn rezultojn por la latinidaj
>lingvoj. Ĉu vi proponas uzi mane senambiguigitan tekstaron por trejni
>la
>senambiguilon?
>
>Kore,
>Hektor

Kore,
Darshak
Reply all
Reply to author
Forward
0 new messages