Invito al studentoj por aktivi esperante dum Google Summer of Code

8 views
Skip to first unread message

Hèctor Alòs i Font

unread,
Jan 5, 2013, 5:21:36 AM1/5/13
to
Ĉiujare (kaj verŝajne denove en 2013) Guglo donas stipendiojn, por ke studentoj evoluigu liberan kaj malfermitkodan programaron dum la somero.

Enkadre de tio, ĉiujare deko da studentoj kunlaboras kun Apertium por evoluigi aŭtomatajn tradukilojn, inkluzive tradukilojn el kaj al Esperanto.

Temas pri ĉ. 5000 USD por laboro ĉefe inter majo kaj aŭgusto. En tiu periodo la studentoj laboros 20-30 horojn semajne sub la gvido de spertulo. Studento estas ĉiu kiu enskribiĝis en universitata aŭ altlerneja institucio kaj havas 18 jarojn aŭ pli.

La studata fako ne estas aparte grava (kaj en Apertium ni havis sufiĉe diversajn studentojn) kaj ankaŭ post-gradaj studentoj (ekz. doktoriĝantoj) povas partopreni.

Se ĉio okazas kiel en la pasintaj jaroj, la kandidatoj devos prezenti siajn projektojn komence de marto al Apertium-komisiono, kiu elektos dekon el ili. Krom tio, dum aprilo kaj majo ili devas pli bone konatiĝi kun la uzotaj iloj (tiuokaze kun la Apertium-programaro).

Anglalingvajn informojn pri la pasintjaraj Apertium-projektoj stipendiitaj de Guglo eblas legi ĉe: http://wiki.apertium.org/wiki/Google_Summer_of_Code/Application_2012 Kaj pri la Guglo-stipendioj, ĉi tie: http://code.google.com/p/google-summer-of-code/wiki/AdviceforStudents

La evoluigo de aŭtomata tradukilo inter du lingvoj por Apertium daŭras ĉirkaŭ 2-3 monatojn.

Esence tio konsistas en: 1) kreado de dulingva vortaro surbaze de ekzistanta libere uzebla elektronika vortaro; 2) difino de la morfologio de la koncerna lingvo, se ĝi ankoraŭ ne estas difinita en Apertium (t.e. necesas klarigi, kiaj estas ĉiuj formoj de la vortoj: nombro, genro, kazo, konjugacio k.s.); 3) kreado de sinsekvo da reguloj, permesantaj ŝanĝi strukturojn de la lingvo, de kiu oni tradukas, al tiuj de la lingvo, al kiu oni tradukas  (por ne havi krudan laŭvortan tradukon, donatan de la unuaj du paŝoj). Pli detala klarigo en Esperanto de la farenda laboro legeblas ĉe http://www.teleskopo.com/Plena-dosiero-2011.pdf (p. 5-19).

Bonvenaj estas proponoj de tradukiloj el kaj al malpli uzataj lingvoj, ne ĝuantaj grandan komputilan subtenon (ekz. la bretona, la kurda aŭ la tatara). Ekzemple, danke al la pasintjaraj stipendioj studentoj laboris super tradukiloj inter la tatara kaj la kazaĥa, la keĉua kaj la hispana, la indonezia kaj la malaja, la malta kaj la hebrea kaj la slovena kaj la kroata.

Studento kiu volus plibonigi la kvaliton de la tradukoj de Esperanto al la angla estus ankaŭ bonvena.

Interesitoj pri la evoluigo de Esperanto-tradukiloj bv. kontakti Hektor Alos i Font ( hecto...@gmail.com ) aŭ Jacob Nordfalk ( jacob.n...@gmail.com ) laŭeble dum januaro.

Vi povas kontakti nin ankaŭ se vi interesiĝas pri la evoluigo de aŭtomata tradukilo por malpli uzata lingvo senrilata al Esperanto.

Federico Gobbo

unread,
Jan 30, 2013, 6:21:11 AM1/30/13
to apert...@googlegroups.com, Antonio Barbieri
Saluton al ĉiuj!

Kelkajn tagojn antaŭe, mi respondis al la alvoko de Héctor kaj Jacob per konkreta propono.
Mi estas postdoktora esploristo ĉe Universitato de L'Aquila (Italio) en esplorgrupo pri A.I.
kaj havas la ŝancon magistrigi per disertaĵo pri Per-Automata Tradukado (PAT). Mia ideo
estas mentori mem magistronton por aldoni lingvoparon eo-it. 

Mi iom diskutis la detalojn kun ambaŭ, kaj feliĉe rapide trovis kandidaton, kiu eklernas
Esperanton nun kaj legas kopie chi tiun mesaĝon. Li nomiĝas Antonio Barbieri.

Por mem praktikiĝi al la sistemo, mi instalis diversajn lingvoparojn havante Esperanton
au la italan -- tiel mi esperas kompreni la funkciadon de Apertium pli efike.

Mi nun estas en la fazo kontribui al ekzistanta lingvoparo, tiel, ke mi povas eksperimenti
rekte kaj espereble bonkvalite. Mi decidis kontribui al eo-en.

Kiamaniere mi povas komenci aldoni ion, prefere al la dulingva vortaro?

Mi estos dankema por ĉia helpo mi ricevos.

Amike,

Federico Gobbo

PS
Pri mi Esperante vidu mian retejon:

Jacob Nordfalk

unread,
Jan 30, 2013, 7:52:28 AM1/30/13
to apert...@googlegroups.com, Antonio Barbieri
Saluton Federico, kaj bonvenon al Apertium!

Pri eo-en, kio plej ege mankas estas pli bona elekto de vortoj en la direkto de Esperanto al la angla.

Mi montru al vi unu ekzemplon.

Mi supozas ke vi instalis la lingvoparon de SVN (http://wiki.apertium.org/wiki/Minimal_installation_from_SVN) kaj estas nun en dosiero apertium/trunk/apertium-eo-en


$ echo 'Mi montru al vi unu ekzemplon:' | apertium -d . eo-en
I show to you one sample:


Ĉi tie devus esti 'example' kaj ne 'sample'.

Nun malfermu apertium-eo-en.eo-en.dix kaj serĉu ĉie por 'ekzemplo'.
(La jena estas rezulto de komando 'grep ekzemplo apertium-eo-en.eo-en.dix')


<e>       <p><l>laŭ<b/>la<b/>ekzemplo<s n="pr"/></l>   <r>along<b/>the<b/>line<s n="pr"/></r></p></e>
<e>       <p><l>laŭ<b/>la<b/>ekzemploj<s n="pr"/></l>  <r>along<b/>the<b/>lines<s n="pr"/></r></p></e>
<e r="RL"><p><l>ekzemplo<s n="n"/></l>                 <r>example<s n="n"/></r></p></e>
<e>       <p><l>ekzemplo<s n="n"/></l>                 <r>sample<s n="n"/></r></p></e>
<e r="LR"><p><l>ekzemplodona<s n="adj"/></l>           <r>exemplary<s n="adj"/></r></p></e>

La interesaj linioj kompreneble estas:
<e r="RL"><p><l>ekzemplo<s n="n"/></l>                 <r>example<s n="n"/></r></p></e>
<e>       <p><l>ekzemplo<s n="n"/></l>                 <r>sample<s n="n"/></r></p></e>


La r="RL" signifas ke tiu traduko nur validas de R/Right/dekstra al L/Left/maldekstra.
Vi povas do korekti la problemon ŝanĝante al:

<e><p><l>ekzemplo<s n="n"/></l>                 <r>example<s n="n"/></r></p></e>
<e r="RL">       <p><l>ekzemplo<s n="n"/></l>                 <r>sample<s n="n"/></r></p></e>


Mi scias ke tio ĉi estas ege banala, sed mi tamen sugestas al vi trovi kaj korekti la 20-30 plej gravajn problemojn de tiu ĉi tipo (aŭ ĝis vi enuas); ili ege plibonigus la lingvoparon kaj estas vere facila komenca laboro, kaj helpos al vi alkutimiĝi al la labormanieroj.

Poste vi ankaŭ alŝutu al SVN, por dividi la plibonigojn kun ni.

Post tio vi legu http://www.teleskopo.com/Plena-dosiero-2011.pdf ('5. La Apertium-vortaroj') kaj ni povos diskuti kion fari por korekti tiajn erarojn aŭtomate kaj vi pli facile aldonos novajn vortojn (por aldoni tutnovan vorton vi devos redakti ne nur unu, sed 3 dosierojn).

Kore, Jacob


2013/1/30 Federico Gobbo <federic...@gmail.com>
Mi nun estas en la fazo kontribui al ekzistanta lingvoparo, tiel, ke mi povas eksperimenti
rekte kaj espereble bonkvalite. Mi decidis kontribui al eo-en.

Kiamaniere mi povas komenci aldoni ion, prefere al la dulingva vortaro?

Mi estos dankema por ĉia helpo mi ricevos.

Amike,

Federico Gobbo

PS
Pri mi Esperante vidu mian retejon:




Il giorno sabato 5 gennaio 2013 11:21:36 UTC+1, Hèctor Alòs i Font ha scritto:
Ĉiujare (kaj verŝajne denove en 2013) Guglo donas stipendiojn, por ke studentoj evoluigu liberan kaj malfermitkodan programaron dum la somero.

Enkadre de tio, ĉiujare deko da studentoj kunlaboras kun Apertium por evoluigi aŭtomatajn tradukilojn, inkluzive tradukilojn el kaj al Esperanto.

Temas pri ĉ. 5000 USD por laboro ĉefe inter majo kaj aŭgusto. En tiu periodo la studentoj laboros 20-30 horojn semajne sub la gvido de spertulo. Studento estas ĉiu kiu enskribiĝis en universitata aŭ altlerneja institucio kaj havas 18 jarojn aŭ pli.

La studata fako ne estas aparte grava (kaj en Apertium ni havis sufiĉe diversajn studentojn) kaj ankaŭ post-gradaj studentoj (ekz. doktoriĝantoj) povas partopreni.

Se ĉio okazas kiel en la pasintaj jaroj, la kandidatoj devos prezenti siajn projektojn komence de marto al Apertium-komisiono, kiu elektos dekon el ili. Krom tio, dum aprilo kaj majo ili devas pli bone konatiĝi kun la uzotaj iloj (tiuokaze kun la Apertium-programaro).

Anglalingvajn informojn pri la pasintjaraj Apertium-projektoj stipendiitaj de Guglo eblas legi ĉe: http://wiki.apertium.org/wiki/Google_Summer_of_Code/Application_2012 Kaj pri la Guglo-stipendioj, ĉi tie: http://code.google.com/p/google-summer-of-code/wiki/AdviceforStudents

La evoluigo de aŭtomata tradukilo inter du lingvoj por Apertium daŭras ĉirkaŭ 2-3 monatojn.

Esence tio konsistas en: 1) kreado de dulingva vortaro surbaze de ekzistanta libere uzebla elektronika vortaro; 2) difino de la morfologio de la koncerna lingvo, se ĝi ankoraŭ ne estas difinita en Apertium (t.e. necesas klarigi, kiaj estas ĉiuj formoj de la vortoj: nombro, genro, kazo, konjugacio k.s.); 3) kreado de sinsekvo da reguloj, permesantaj ŝanĝi strukturojn de la lingvo, de kiu oni tradukas, al tiuj de la lingvo, al kiu oni tradukas  (por ne havi krudan laŭvortan tradukon, donatan de la unuaj du paŝoj). Pli detala klarigo en Esperanto de la farenda laboro legeblas ĉe http://www.teleskopo.com/Plena-dosiero-2011.pdf (p. 5-19).

Bonvenaj estas proponoj de tradukiloj el kaj al malpli uzataj lingvoj, ne ĝuantaj grandan komputilan subtenon (ekz. la bretona, la kurda aŭ la tatara). Ekzemple, danke al la pasintjaraj stipendioj studentoj laboris super tradukiloj inter la tatara kaj la kazaĥa, la keĉua kaj la hispana, la indonezia kaj la malaja, la malta kaj la hebrea kaj la slovena kaj la kroata.

Studento kiu volus plibonigi la kvaliton de la tradukoj de Esperanto al la angla estus ankaŭ bonvena.

Interesitoj pri la evoluigo de Esperanto-tradukiloj bv. kontakti Hektor Alos i Font ( hecto...@gmail.com ) aŭ Jacob Nordfalk ( jacob.n...@gmail.com ) laŭeble dum januaro.

Vi povas kontakti nin ankaŭ se vi interesiĝas pri la evoluigo de aŭtomata tradukilo por malpli uzata lingvo senrilata al Esperanto.

--
You received this message because you are subscribed to the Google Groups "Apertium Esperanto" group.
To unsubscribe from this group and stop receiving emails from it, send an email to apertium_eo...@googlegroups.com.

To post to this group, send email to apert...@googlegroups.com.
For more options, visit https://groups.google.com/groups/opt_out.
 
 



--
Jacob Nordfalk
Androidudvikler og -underviser på IHK og Lund&Bendsen

Federico Gobbo

unread,
Jan 31, 2013, 9:52:15 AM1/31/13
to apert...@googlegroups.com, Antonio Barbieri
Kara Jacob,

ĉi-posttagmeze mi havas iom da tempo por profundiĝi al Apertium, antaŭ
Skajpa renkontiĝo. Fakte, mi klopodis sekvi brute vian ekzemplon, sed
evidentemi miskomprenis ion:

$ echo 'Mi montru al vi unu ekzemplon:' | apertium -d . eo-en
Error: Mode eo-en does not exist. Try one of:
en-eo-np
en-eo-old3stage
en-eo-profiler
en-eo-superblank-test
en-eo-trigram

Kio signifas la modojn? Mi ludis iomete, sed jen la malesperigajn rezultojn:

$ echo 'Mi montru al vi unu ekzemplon:' | apertium -d . eo-en-np
Error: Mode eo-en-np does not exist. Try one of:
en-eo-np
en-eo-old3stage
en-eo-profiler
en-eo-superblank-test
en-eo-trigram

Samajn rezultojn por la aliaj modoj...

Por scii kiom larĝa estas la problemo, mi eksperimentis iomete,
ŝanĝante lingvoparon al eo-ca, kiu donis al mi nenian problemon,
male al eo-es kaj eo-fr.

$ echo 'Mi montru al vi unu ekzemplon:' | apertium -d . eo-ca
Error: Mode eo-ca does not exist.

Miasurprize, la dosierujo modes/ malplenas! Same en lingvoparo eo-fr.
En lingvoparo eo-es ĝi eĉ ne ekzistas, sed eble por la diversa maniero
en kiu ĝi funkcias.

Ĉu iu alia povas helpi?

Konsideru, ke male kaze de la lingvoparo es-it ĉio ŝajnas funkcii.
Ekzemple, mi klopodis uzi kelkajn modojn per hodiaŭa titolo de El Paìs,
kaj jen la esperigaj rezultoj:

$ echo 'Empresarios de la construcción copan los pagos anotados' |
apertium -d . es-it-generador
| Imprenditori ~di ~la costruzione *copan ~i pagamenti annotati

$ echo 'Empresarios de la construcción copan los pagos anotados' |
apertium -d . es-it-tagger
| ^Empresario<n><m><pl>$ ^de<pr>$ ^el<det><def><f><sg>$
^construcción<n><f><sg>$ ^*copan$ ^el<det><def><m><pl>$
^pago<n><m><pl>$ ^anotar<vblex><pp><m><pl>$^.<sent>$

$ echo 'Empresarios de la construcción copan los pagos anotados' |
apertium -d . es-it-chunker
| ^Nom<SN><m><pl>{^imprenditore<n><2><3>$}$ ^prep<PREP>{^di<pr>$}$
^det_nom<SN><f><sg>{^il<det><def><2><3>$ ^costruzione<n><2><3>$}$
^unknown<unknown>{^*copan$}$
^det_nom_adj<SN><m><pl>{^il<det><def><2><3>$ ^pagamento<n><2><3>$
^annotare<vblex><pp><2><3>$}$^punt<sent>{^.<sent>$}$

Mi dankas ĉian helpon de la Esperant-lingvan Apertium-an komunumon.

Amike,

Federico

PS
Kaze de nesolvo, mi turnos al la ĝenerala dissendlisto.

2013/1/30 Jacob Nordfalk <jacob.n...@gmail.com>:
Federico Gobbo
http://federicogobbo.name
skype://federicogobbo

Jacob Nordfalk

unread,
Jan 31, 2013, 2:43:03 PM1/31/13
to apert...@googlegroups.com, Antonio Barbieri


2013/1/31 Federico Gobbo <federic...@gmail.com>

Kara Jacob,

ĉi-posttagmeze mi havas iom da tempo por profundiĝi al Apertium, antaŭ
Skajpa renkontiĝo. Fakte, mi klopodis sekvi brute vian ekzemplon, sed
evidentemi miskomprenis ion:

$ echo 'Mi montru al vi unu ekzemplon:' | apertium -d . eo-en
Error: Mode eo-en does not exist. Try one of:
   en-eo-np
   en-eo-old3stage
   en-eo-profiler
   en-eo-superblank-test
   en-eo-trigram


Mi komprenas nenion de tio ĉi. Vi havas nur duonon de la 'modes'!
De kie vi elŝutis la aferon ?
Ĉu vi fakte elŝutiis la lingvoparon de SVN (http://wiki.apertium.org/wiki/Minimal_installation_from_SVN)  ??

Bonvolu kontroli la 'modes.xml'
$ ll modes.xml
-rw-rw-r-- 1 j j 16669 okt 18 16:58 modes.xml

 

Kio signifas la modojn?

Reale nur eo-en kaj en-eo estas interesaj. Temas pri la lingvodirektoj.
Ĉu vi provis http://wiki.apertium.org/wiki/Apertium-viewer ?
La en-eo-np estis eksperimento pri propraj nomon (noun proper).
La aliaj estis aliaj eksperimentoj.

 
Mi ludis iomete, sed jen la malesperigajn rezultojn:

$ echo 'Mi montru al vi unu ekzemplon:' | apertium -d . eo-en-np
Error: Mode eo-en-np does not exist. Try one of:
   en-eo-np
   en-eo-old3stage
   en-eo-profiler
   en-eo-superblank-test
   en-eo-trigram

Vi skribis eo-en-np sed evicente nur en-eo-np ekzistas. Interŝanĝu 'en' kaj 'eo'.
 

Samajn rezultojn por la aliaj modoj...



Provu
$ echo 'I will show you an example:' | apertium -d . en-eo-np

 
Por scii kiom larĝa estas la problemo, mi eksperimentis iomete,
ŝanĝante lingvoparon al eo-ca, kiu donis al mi nenian problemon,
male al eo-es kaj eo-fr.

$ echo 'Mi montru al vi unu ekzemplon:' | apertium -d . eo-ca
Error: Mode eo-ca does not exist.

Miasurprize, la dosierujo modes/ malplenas! Same en lingvoparo eo-fr.
En lingvoparo eo-es ĝi eĉ ne ekzistas, sed eble por la diversa maniero
en kiu ĝi funkcias.

Ĉu iu alia povas helpi?

Mi ne scias kiel, sed viaj lingvoparaj dosierujoj ŝajnas rompitaj. Tion mi neniam spertis. Elŝutu denove de SVN.

Venu al IRC aŭ sendu la enhavon de la dosierujoj.

 

Konsideru, ke male kaze de la lingvoparo es-it ĉio ŝajnas funkcii.
Ekzemple, mi klopodis uzi kelkajn modojn per hodiaŭa titolo de El Paìs,
kaj jen la esperigaj rezultoj:

$ echo 'Empresarios de la construcción copan los pagos anotados' |
apertium -d . es-it-generador
| Imprenditori ~di ~la costruzione *copan ~i pagamenti annotati

Tre bone.

Federico Gobbo

unread,
Feb 1, 2013, 2:49:03 AM2/1/13
to apert...@googlegroups.com, Antonio Barbieri
Kara Jacob,

mi instalis de SVN kiel vi diris kaj reinstalis la lingvoparon denove. Nenio shanghighis. Nun mi estas ekvojaghanta, kaj eble mi reinstalos sur alia mashino -- mi estas konsideranta la shancon virtualigi Ubuntu mem per VirtualBox, char mi revenos en La-Aglon post du semajnoj...

Mi diros al vi. Dankon por via daura helpo,

amike, Apertiume,

Federico
--
You received this message because you are subscribed to the Google Groups "Apertium Esperanto" group.
To unsubscribe from this group and stop receiving emails from it, send an email to apertium_eo...@googlegroups.com.
To post to this group, send email to apert...@googlegroups.com.
Visit this group at http://groups.google.com/group/apertium_eo?hl=eo.
For more options, visit https://groups.google.com/groups/opt_out.
 
 

Hèctor Alòs i Font

unread,
Feb 1, 2013, 9:48:37 AM2/1/13
to apert...@googlegroups.com, Antonio Barbieri
Saluton Federico,

Mi konfirmas la aserton de Jacob: ankaŭ mi spertis neniun problemon ĉe la instalado de apertium-eo-en. Jen tio, kion mi faris:

# mi metas flanken la antaŭan instalaĵon
mv apertium-eo-en apertium-eo-en.130201
# elŝutas la aktualan pakaĵon
svn co https://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-eo-en
# eniras la dosierujon
cd apertium-eo-en
# kreas Makefile
./autogen.sh
# generas la dosierojn
make
# testas la ekzemplon

echo 'Mi montru al vi unu ekzemplon:' | apertium -d . eo-en

Kaj mi ricevas:

I show to you one sample:

Indas rimarki, ke ekzistas malsamaj formoj instali. Kelkaj pakaĵoj (bedaŭrinde) postulas ankaŭ "sudo make install" post "make". Tio okazas al eo-ca kaj eo-es (sed ne al eo-en kaj eo-fr). Mi ne sufiĉe fakas pri tiaj aferoj por ŝanĝi tion. Simple tion havu enkape.

Kore,
Hektor

2013/2/1 Federico Gobbo <federic...@gmail.com>
Reply all
Reply to author
Forward
0 new messages