Salut Sylvain,
j'ai lu la description du fonctionnement et j'ai relevé des choses à reformuler et d'autres sources de dysfonctionnement.
- Dans le premier paragraphe "Phon2graph", tu dis :
les sons /wa/ ou /ks/ sont donc considérés comme des phonèmes uniques.
Pour /ks/, cela ne semble pas poser problème mais pour /wa/, ce n'est pas toujours vrai.
J'ai testé le wikicolor avec les mots suivants (à mettre dans les phrases de débuggage) :
un accident, le tocsin, le wapiti, de la ouate, des watts, une kawasaki, la langue ajawa, jouer à l'awalé, le Botswana, manger des chawarmas, des chihuahuas, une équation, un aquarium, un voyage
J'ai obtenu ceci :
un accident, le tocsin, le apiti, de la ouate, des atts, une kawasaki, la langue ajawa, jouer à l’ awalé, le Botswana, manger des chawarmas, des chihuahuas, une équation, un aquarium, un voyage
Pour les mots contenant l'enchainement de lettres 'wa', il faudrait clairement que chaque phonème soit considéré séparément : 2 sons pour 2 lettres, chacune existant dans le fidel dans le bon phonème. Lorsque ces lettres sont à l'intérieur de mots, l'algo ne peut pas coloriser puisqu'il n'existe pas le digramme wa dans la colonne du son /wa/. Mais lorsque ces 2 lettres sont en début de mot, l'algo supprime tout simplement la première lettre comme dans "wapiti" ou "watt". Ce n'est pas possible.
Cette unification des sons /w/ et /a/ ne peut pas être imposée a priori mais seulement si ce traitement séparé ne peut pas aboutir. Ceci est le cas lorsque /wa/ correspond à un enchainement de lettres commençant avec oi, puisque le i ne peut décemment pas se trouver dans la liste des graphies du son /a/.
Voilà comment je verrai le pointage de quelques uns de ces mots avec mon fidel :
wapiti, watt, ouate, awalé, équation ou équation ou équation
Je préfère la ouate colorisée comme ceci que comme dans le wikicolor actuel. Pour équation, je préfère la première solution. Ce qui pourrait permettre d'enlever dans la case /wa/ du fidel, les graphies ua, oua, a et at. Dans le doc "comparaisonFidels" qu'il faudrait mettre dans le dossier partagé avec la version la plus à jour, il serait peut-être bien de rajouter une colonne avec les graphies du fidel de l'UEPD de 1998 d'où je suis parti pour voir les modifications faites par moi et Roslyn. Dans ce dossier partagé, il faudrait aussi mettre le document de travail élaboré par Ben (je crois) et mis en forme par Robert lors du travail de refonte initié par Roslyn.
A noter que dans mon fidel issu de UEPD, dans le son /w/ figure la graphie 'o' qui pourrait permettre de pointer le glissement possible de valeur de la lettre 'o' si on répète très vite la phrase : Do Alice a les doigts lisses. (Il a fallu batailler pour trouver un prénom sans jeu de mot avec mon nom. La je suis tranquille, ma femme ne l'a pas vu !!!)
Do Alice a les
doigts lisses.
Do Alice a les
doigts lisses.
Ce 'o' dans le son /w/ pourrait aussi servir pour coloriser "
o.in" en /w.ɛ̃/ en deux couleurs séparées plutôt que de faire
"oin" en /wɛ̃/ en un trigramme
bicolore.
J'ai donc poussé plus loin la recherche sur la colorisation des sons /w/, /wɛ̃/ et /wa/.
Je viens de voir des différences de pointage avec le fidel de Roslyn :
Dans le son /w/, elle a supprimé le 'o'. On ne pourrait plus écrire, comme avec mon fidel :
Soazic
Est-ce une raison suffisante pour que je garde ce 'o' dans /w/ dans mon fidel ? Notre breton de service nous dira. C'est la région de France où il y a le plus de Soazic.
Dans le son
/wɛ̃/
, aucune différence.
Dans le son /wa/, elle a enlevé les graphies 'oua', 'ua', 'a', 'at' comme je m’apprête à le faire (cf plus haut). Elle a aussi enlevé 'oye' et 'oyes' qu'on trouve dans le wiktionnaire mais pas dans des mots courants. Le plus surprenant, c'est la suppression du 'o' dont nous avons besoin pour coder les mots "voyage" ou encore "soyons, soyez". Cette suppression est compensée par le rajout de la graphie 'oy'. Je pense, et il faudra vérifier auprès de Roslyn et Piers, que cela vient de leur fameuse trouvaille de la liaison interne. C'est pour cela qu'ils n'ont pas besoin du 'u' bicolore pour "tuyau" par exemple ou des graphies bicolores 'i', 'y' et 'hi' pour transcrire /ij/ dans "client, hier ou cryothérapie". Je pense que Roslyn pointerait sur sa version du phonographe comme ceci :
tuy͜au, cli͜ent, hi͜er, cry͜othérapie
alors que moi, je pointerais :
Je ne sais pas comment wikicolor pourrait marquer les liaisons internes comme Roslyn et Piers. Faudra déjà se pencher sur le traitement des liaisons entre les mots.
- Dans le paragraphe "Alignement" tu dis : "
À chaque alignement, le phonème aligné et la graphie choisie sont supprimées."
Je dirais plutôt :
Après chaque alignement, le phonème aligné et la graphie choisie
ne sont plus pris en compte pour la recherche suivante d'alignement.
- Dans le paragraphe "Cas des phonèmes bigraphes"
Il faut revoir cette dénomination de "bigraphe" qui n'existe pas d'après mes recherches. Surtout que tu parles d'enchainement de marques phonétiques. Je ne suis pas assez calé en linguistique phonétique pour trouvé le bon terme.
- dans le paragraphe "
Identification de la graphie cible"
Ta description du travail de l'algorithme ne me semble pas correspondre au fonctionnement que j'ai compris sur la description du traitement du mot "essentiel".
J'ose proposer quelque chose pour corriger les étapes 5, 6 et 7. Je remets aussi les phonèmes entre //. Mais tu connais mieux ton algo que moi.
- "essentiel" /esɑ̃sjɛl/ : /l/ → 'l'
- "essentie" /esɑ̃sjɛ/ : /ɛ/ → 'e'
- "essenti" /esɑ̃sj/ : /j/ → 'i'
- "essent" /esɑ̃s/ : /s/ → 'ssent' (ou sent ou t,comme on le verra par la suite)
- "e" /esɑ̃/ : /ɑ̃/ → 'e'
- "" /es/ : alignement impossible puisqu'il n'y a plus de lettres : on revient au phonème précédent (cf étape 5)
- "e" /esɑ̃/ : /pas d'autres solutions que celle prise en 5 puisque le "e" est la dernière lettre. On revient donc au phonème précédent (cf étape 4)
- essent" /esɑ̃s/ : /s/ il reste 'sent' et 't'. On prend la plus longue
- "es" /esɑ̃/ : /ɑ̃/ → alignement impossible : 'es' n'existe pas dans la liste des graphies du son /ɑ̃/ : on revient au phonème précédent
- "essent" /esɑ̃s/ : /s/ → il reste 't'. On le prend.
- "essen" /esɑ̃/ : /ɑ̃/ → 'en'
- "ess" /es/ : /s/ → 'ss' (ou 's')
- "e" /e/ : /e/ → 'e'
Résultat : /e/→e, /s/→ss, /ɑ̃/→en, /s/→j, /ɛ/→e, /l/→l
Ouf, ça m'a fait travailler 7 heures de faire tous ces tests et toutes ces comparaisons !!!