Latviesu valodas morfo-sintaktiskais analizators.

7 views
Skip to first unread message

Uldis Bojars

unread,
Oct 23, 2009, 12:45:36 PM10/23/09
to semw...@googlegroups.com
Veikmīgi palaidu latviešu valodas morfo-sintaktisko analizatoru [1] uz
Mac OS X 10.5. Līdzīga pieeja var noderēt arī Linux lietotājiem (kur
palaist šo rīku varētu būt vienkāršāk).

[1] http://www.semti-kamols.lv/doc_upl/annotator-r710.zip

Lai šī ziņa būtu īsāka, pilnu dokumentāciju par problēmām un
risinājumiem var atrast [2].

[2] http://semweb.mii.lu.lv/wiki/MorfologiskaisAnalizators/MacOsX

Galvenā problēma bija saistīta ar Java un SWI-Prolog savietojamību zem
Mac OS X. Analizators ir kompilēts ar Java 6 (dokumentācija gan saka,
ka pietiek ar Java 5). Vienīgā Java 6 versija, ko Apple piedāvā
Leopard lietotājiem, ir 64-bitu un tā nevar ielādēt SWI-Prolog
bibliotēku (libjpl.dylib), kas ir 32-bitu.

Risinājums: instalēt SoyLatte - 32-bitu Java 6 priekš Mac OS X.

Diemžēl, SoyLatte ierobežojums ir tāds, ka Java programmu GUI strādā
tikai zem X11 (kuru nepieciešams uzstādīt, ja vien tas jau nav
izdarīts). Apple paša GUI, protams, izskatās smukāk.

Nākamā problēma ir piedabūt programmu atrast SWI-Prolog - Java
interfeisa (JPL) failus. Ziņas beigās pievienoju run.sh faila tekstu,
kurā norādīti vajadzīgie parametri.

Pēdējā problēma bija tā, ka norādes uz Prolog failiem lietoja Windows
stila atdalītājus ("\"). To var labot nomainot "\" uz "/". Lai būtu
ērtāk šo procesu atkārtot, pievienoju izlaboto JAR failu.

Rezultātā programma strādā (parādās lietotāja interfeiss un ir
iespējams pieprasīt teikuma analīzi).

Visu labu,
Uldis

--- run.sh teksts: ---

export SWI_HOME_DIR=/opt/local/lib/swipl-5.6.63
export CLASSPATH=/opt/local/lib/swipl-5.6.63/lib/jpl.jar:lib/annotator.jar:lib/morphology.jar:lib/chunker.jar:lib/cpdetector.jar

java -Xmx512M -Djava.library.path=/opt/local/lib/swipl-5.6.63/lib/i386-darwin9.7.0
lv.semti.Marketajs.MarkApp

--- --- ---

chunker.jar

Pēteris Caune

unread,
Oct 29, 2009, 7:09:49 PM10/29/09
to semw...@googlegroups.com
Sekojot Ulda instrukcijām un tās pielāgojot izdevās morfolo-sintaktisko analizatoru iedarbināt arī uz Ubuntu 9.10 (Karmic). Būtiskākā atšķirība -- libjpl.so fails jāielādē pirms java process sāk darbu. Ja šo failu ielādē java (ar -Djava.library.path=... palīdzību), programmas saskarne parādās, bet, mēģinot analizēt kādu tekstu, izlec kļūda:

java: symbol lookup error: /usr/lib/swi-prolog/lib/i386/time.so: undefined symbol: PL_new_atom

run.sh piemērs atrodams šeit: http://semweb.mii.lu.lv/wiki/MorfologiskaisAnalizators/UbuntuLinux

Pēteris
Reply all
Reply to author
Forward
0 new messages