Salute! Io vole organisar un projecto collaborative compilar un corpore comprensive de textos de interlingua, in forma electronic.
Le objecto de iste corpore de textos de interlingua va esser adjutar con analyses de computator del lingua, esser un resource pro le communitate, e facilitar le disveloppamento de utensiles in linea pro interlingua.
Le scopo de iste projecto include, mais non limate a, 1) faciente un dictionario frequentia pro interlingua, e 2) faciente intelligentia artificial pro traducer interlingua (como Google Translate).
Assi, io cerca pro collaboratores qui me adjutara assembler un collection grande de textos de interlingua. Io necessita vostre adjuta con trovar e collectionar documentos electronic e sitos web in interlingua includiente PDFs e pares del mesme phrases in interlingua e anglese.
Per exemplo, Tatoeba.org es un fonte excellente de phrases, mais illo solmente contine circa 25,000 phrases de interlingua e circa 15,000 pares de phrases in interlingua e anglese. Iste es troppos pauc pares de phrases pro facer un modelo de alte-qualitate traduction machina.
Mesmo 55,000 phrases de interlingua combinate de Tatoeba e Wikipedia es inadequate pro facer un modelo de interlingua comparabile a altere linguas tal como anglese, germano, francese, espaniol, italiano, portuguese, e mesmo esperanto.
Si tu ha interresse in contribuer a iste effortio, o tu ha alcun suggestions, per favor inviar un message a
interlin...@gmail.com o adder vostre commentos aqui.
Cordialmente,
Todd Mockler