Bravo et Félicitations.
L'algorithme que j'avais implémenté pour la segmentation
"orthographique" utilisait l'algorithme de césure de LaTeX dont
j'avais modifié les patrons français.
Je n'avais jamais eu le temps de bien vérifier tous les cas et je sais
qu'il restait des bugs (sans parler des cas debattables) . Et je ne
suis pas sûr que ce découpage orthographique a jamais servi a
quelqu'un, n'ayant eu aucun retour.
Il est important de souligner que la syllabation phonetique et le
decoupage orthographique par césure ne correpondent pas forcement
(djéà pour les consonnes doubles: bal-la-de): .
Pour la syllabation phonétique, j'avais pris la décisison que les
schwas finaux ne comptaient pas donc un mot comme "arbre" est un
mono-syllabe phonetiquement dans lexique (et tout mes choix cela sont
discutables, c'est pourquoi je fourni les algorithmes sur
https://github.com/chrplr/openlexicon: afin que les gens puissent les
adapter à leurs besoins).
Dans une version future de Lexique, nous reverrons ce champ
ortho-syll, peut-être avec votre algo.
--
Christophe Pallier
Directeur de Recherche CNRS
EMR CNRS 9003 & INSERM-CEA Cognitive Neuroimaging Lab U992
(
http://www.unicog.org)
Neurospin, CEA/SAC/DRF/Joliot, Point Courrier 156
91191 Gif-sur-Yvette Cedex
> --
> Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "Lexique".
> Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse
lexiqueorg+...@googlegroups.com.
> Cette discussion peut être lue sur le Web à l'adresse
https://groups.google.com/d/msgid/lexiqueorg/cb5eb81a-0541-4d3e-97bc-895b61c5eb8cn%40googlegroups.com.