Conversie dicționar din format Hunspell în format NetSpell

72 views
Skip to first unread message

Cristian Stoica

unread,
Sep 14, 2015, 2:05:16 PM9/14/15
to rospell: corectoare ortografice românești
Salutare.

Încerc să construiesc un dicționar pentru limba română pentru a fi folosit/inclus cu GitExtensions.
Acesta trebuie convertit din formatul Hunspell în formatul NetSpell (motorul intern folosit pentru corectură ortografică în GitExtensions).

Lucrez cu ultima versiune (3.3.10) a dicționarelor în care cred că am găsit câteva erori.

De exemplu, în fișierul ro_RO.aff pentru sufixele următoare lipsește ultima coloană (#4) care definește condiția.
Din câte am văzut în manualul hunspell pentru nicio condiție se pune punct (.)

SFX q   0    ă
SFX q   0    a
SFX q   0    ei
SFX q   0    e
SFX q   0    ele
SFX q   0    elor

Extras din manualul hunspell:
----------
Fields of an affix rules:

(0) Option name

(1) Flag

(2) stripping characters from beginning (at prefix rules) or
end (at suffix rules) of the word

(3) affix (optionally with flags of continuation classes, separated by a slash)

(4) condition.

Zero stripping or affix are indicated by zero. Zero condition is indicated by dot.
Condition is a simplified, regular expression-like pattern, which must be met
before the affix can be applied. (Dot signs an arbitrary character. Characters in braces
sign an arbitrary character from the character subset. Dash hasn't got special
meaning, but circumflex (^) next the first brace sets the complementer character set.)

(5) Optional morphological fields separated by spaces or tabulators.

----------
https://github.com/hunspell/hunspell/blob/master/man/hunspell.5

Numai bine.
Cristian Stoica.

Cristian Stoica

unread,
Oct 14, 2015, 11:26:25 PM10/14/15
to rospell: corectoare ortografice românești
Am finalizat. Dicționarul în format NetSpell care se poate folosi cu GitExtensions:

https://github.com/gitextensions/gitextensions/pull/2979

Am păstrat header-ul original cu copyright-ul, dar am adăugat și descrierea mea înainte. Sper că e OK.
Reply all
Reply to author
Forward
0 new messages