WikiColor : mots inconnus du dictionnaire & mots non alignables

14 views
Skip to first unread message

Sylvain Coulange

unread,
May 22, 2020, 6:33:05 PM5/22/20
to Apprentissage des Langues Et Multimodalité (ALEM)
Salut !

Je vous propose une nouvelle fonctionnalité pour WikiColor :

L'idée, c'est qu'on puisse ensuite cliquer sur l'icône qui dit qu'un mot n'est pas dans le dictionnaire, ça ouvre alors une fenêtre pour y ajouter une transcription (voire ça ouvre le phonographe!!), et ça l'enregistre dans le dico, sans passer par la page dédiée d'édition du dictionnaire.

Au début j'avais mis le point d'interrogation pour le mot inconnu et le point d'exclamation pour le bug d'alignement, mais je trouvais ça moins explicite.
Vous pouvez suggérer d'autres icônes depuis cette liste : https://getbootstrap.com/docs/3.3/components/

Qu'en pensez-vous ?

Alexandre DO

unread,
May 23, 2020, 2:05:07 PM5/23/20
to alem...@googlegroups.com
C'est une super fonction qui va permettre de gagner du temps pour les tests.

Pour le bug d'alignement,je mettrais plutôt l'icône glyphicon glyphicon-flash 
image.png
Un clic sur cette icône ouvrirait un message donnant l'explication et afficherait un lien pour signaler le problème (enregistrement dans une base de donnée ou envoi auprès de toi, ou...)

Pour un mot absent du dictionnaire, l'icône que tu as mise est celle qui permet de zoomer les pages de phonodrop et phonographe. Je mettrais donc plutôt la même que dans l'éditeur du dictionnaire.
image.png  
Pour l'interface de l'éditeur, je ne suis pas convaincu de la pertinence du phonographe. 
Avec le phonographe, on crée l'alignement phonie-graphie mais rien ne permet de savoir si c'est correct. Comment savoir si l'utilisateur n'aligne pas n'importe comment ? Par exemple, p.a.n.t.a.l.o.n  ?
Si le mot n'est pas dans le dictionnaire, aucune vérification n'est possible.
Le boulot du phon2graph est justement de faire automatiquement l'alignement entre le mot écrit et une transcription en API donnée.

Quand un mot reste gris parce qu'il n'est pas dans notre dictionnaire, il me semble que la première chose à faire serait de vérifier si l'orthographe est correcte.
Ensuite, il faudrait uniquement saisir la transcription phonétique, avec un clavier en API + archigraphèmes (pour les gens qui ne maitrisent pas l'API). 
Enfin, il faudrait mettre un bouton d'enregistrement avec une demande de confirmation si l'utilisateur est sûr de lui ou un bouton pour soumettre l'ajout.

Qu'en pensez-vous ?

SYLVAIN COULANGE

unread,
May 24, 2020, 10:00:30 AM5/24/20
to Apprentissage des Langues Et Multimodalité, ALEM
Hello !

J'ai ajouté la fonctionnalité sur WikiColor, selon les conseils d'Alexandre. Vous pouvez aussi ajouter le nouveau mot dans le dictionnaire (Enfin!).
Pour s'assurer que ça fonctionne, faites bien un ctrl+F5 pour recharger les styles de la page, après ce sera bon.

Je vous laisse tester et me dire si ça vous convient.

sylvain


De: "Alexandre DO" <do.alex...@gmail.com>
À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Samedi 23 Mai 2020 20:04:30
Objet: Re: [ALEM] WikiColor : mots inconnus du dictionnaire & mots non alignables

--
Pour répondre à ce message, vous pouvez utiliser le bouton "Répondre" de votre messagerie.
Pour écrire sur un nouveau sujet, rendez-vous sur le forum : https://groups.google.com/d/forum/alem-app
---
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "Apprentissage des Langues Et Multimodalité (ALEM)".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse alem-app+u...@googlegroups.com.
Cette discussion peut être lue sur le Web à l'adresse https://groups.google.com/d/msgid/alem-app/CAEO1s86G7s_Pfr8%3D61fgTh6ORPFgP9Jsrdc0KpkkVAQRKd1X1Q%40mail.gmail.com.

SYLVAIN COULANGE

unread,
May 24, 2020, 10:40:36 AM5/24/20
to Apprentissage des Langues Et Multimodalité, ALEM
Je vois déjà que certains d'entre vous on ajouté des mots ;)

Vous pouvez aussi ajouter plusieurs transcriptions possibles en même temps en les séparant par une virgule.


De: "SYLVAIN COULANGE" <sylvain....@univ-grenoble-alpes.fr>

À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Dimanche 24 Mai 2020 16:00:28

Alexandre DO

unread,
May 24, 2020, 11:02:19 AM5/24/20
to alem...@googlegroups.com
Bonjour,

j'ai fait plusieurs essais. C'est quand même bien plus pratique comme cela.

Pour l'ajout de mots au dictionnaire, j'ai vu un bug dans le cas où plusieurs mots sont absents du dictionnaire.
Si on veut rentrer chaque mot avant de re-coloriser, la dernière transcription phonétique est attribuée au(x) mot(s) précédemment saisi(s).
Je ne sais pas si cela se fait sur plus de deux mots car je n'ai pas essayé de saisir plus de 2 mots à la suite.

Pour éviter cela, il faut re-coloriser après chaque nouveau mot saisi.

Pour les problèmes de colorisation, je ne mettrais pas dans l'info-bulle "colorisation impossible". Je mettrais plutôt "bug" ou  "erreur" ou "problème". 

Quand on modifie le dictionnaire, on obtient le message suivant : 
image.png
Qu'est-ce que ça veut dire ?

Alexandre

SYLVAIN COULANGE

unread,
May 24, 2020, 12:37:05 PM5/24/20
to Apprentissage des Langues Et Multimodalité, ALEM
Mince alors! je vais regarder ça.

Pour le message de la popup (avec la checkbox) c'est propre au navigateur, je ne peux pas agir dessus.


De: "Alexandre DO" <do.alex...@gmail.com>

À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Dimanche 24 Mai 2020 17:01:41
--
Pour répondre à ce message, vous pouvez utiliser le bouton "Répondre" de votre messagerie.
Pour écrire sur un nouveau sujet, rendez-vous sur le forum : https://groups.google.com/d/forum/alem-app
---
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "Apprentissage des Langues Et Multimodalité (ALEM)".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse alem-app+u...@googlegroups.com.

SYLVAIN COULANGE

unread,
May 24, 2020, 1:35:04 PM5/24/20
to Apprentissage des Langues Et Multimodalité, ALEM
T'es vraiment fort pour trouver les bugs.

Apparemment ça plante si la page n'est pas rechargée, donc maintenant elle se recharge dès qu'on a ajouté un mot.
C'est mieux parce que le mot ajouté est tout de suite colorisé; par contre le navigateur demande une confirmation avant de recharger les données, ça rajoute un message...
je vois pas trop quoi faire d'autre.

sylvain


De: "SYLVAIN COULANGE" <sylvain....@univ-grenoble-alpes.fr>
À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Dimanche 24 Mai 2020 18:37:03

Alexandre DO

unread,
May 24, 2020, 1:58:02 PM5/24/20
to Apprentissage des Langues Et Multimodalité (ALEM)
ça marche bien comme ça.

Maintenant, faudra voir pour les erreurs d'algo. Si l'utilisateur peut cliquer sur l'icône pour signaler le problème, ça le rendra actif.

Le tout n'est pas de trouver les bugs. Il faut faire de nombreux tests des hypothèses possibles pour essayer de comprendre pourquoi ça bug. 
C'est comme ça que j'apprends des choses quand je n'ai aucune théorie à disposition. 

SYLVAIN COULANGE

unread,
May 24, 2020, 2:25:39 PM5/24/20
to Apprentissage des Langues Et Multimodalité, ALEM
Hello

je viens d'ajouter un bouton pour supprimer une entrée du dico. Finalement ça peut être bien quand on a ajouté un mot par erreur.

Alexandre, les bugs sont tous enregistrés au moment ou le serveur colorise (donc avant que l'utilisateur voit la page s'afficher), avec date et heure de dernière occurrence.
Voilà la liste à l'instant où j'écris :
    "désherber": "2020-5-24 17:52:5",
    "ghibli": "2020-5-24 15:38:15",
    "et": "2020-5-24 18:20:2",
    "synesthésie": "2020-5-24 18:18:23",
    "de": "2020-5-24 18:21:50",
    "se": "2020-5-24 18:18:29",
    "du": "2020-5-24 18:18:31",
    "français": "2020-5-24 18:18:31",
    "ces": "2020-5-24 17:36:35",
    "on": "2020-5-24 18:18:30",
    "cgt": "2020-5-24 17:36:35",
    "rtl": "2020-5-24 17:36:35",
    "flins": "2020-5-24 17:36:35",
    "désherbage": "2020-5-24 17:44:20",
    "mon": "2020-5-24 17:46:36",
    "si": "2020-5-24 18:21:49",
    "bréhaigne": "2020-5-24 17:52:5",
    "tu": "2020-5-24 17:52:5",
    "déshydrater": "2020-5-24 17:52:5",
    "mise": "2020-5-24 18:18:29",
    "l": "2020-5-24 18:18:30",
    "ne": "2020-5-24 18:18:30",
    "g": "2020-5-24 18:18:31",
    "ce": "2020-5-24 18:21:50",
    "sécuritaires": "2020-5-24 18:18:31",
    "contre-récit": "2020-5-24 18:18:31",
    "apple": "2020-5-24 18:21:49",
    "vie": "2020-5-24 18:21:49",
    "mai": "2020-5-24 18:21:50"


Maintenant, dans la plupart des cas, c'est que le mot existe aussi dans sa version épelée dans le dico  ("sa" →/ɛs.a/ ou encore "et" → /i.ti/).
Pour ces mots, un Fidel ne suffira pas !

sylvain


De: "Alexandre DO" <do.alex...@gmail.com>
À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Dimanche 24 Mai 2020 19:58:02

Objet: Re: [ALEM] WikiColor : mots inconnus du dictionnaire & mots non alignables
--
Pour répondre à ce message, vous pouvez utiliser le bouton "Répondre" de votre messagerie.
Pour écrire sur un nouveau sujet, rendez-vous sur le forum : https://groups.google.com/d/forum/alem-app
---
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "Apprentissage des Langues Et Multimodalité (ALEM)".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse alem-app+u...@googlegroups.com.

SYLVAIN COULANGE

unread,
May 24, 2020, 2:33:32 PM5/24/20
to Apprentissage des Langues Et Multimodalité, ALEM
Une solution pour éviter d'avoir toutes ces épellations, ce serait de regénérer le dictionnaire sans enregistrer les mots tout en majuscules (donc les sigles et accronymes).
Ça enlèverait un paquet de prononciations inalignables par le Fidel.

Les "bugs d'alignement" ne seraient alors plus que des emprunts que le Fidel ne peut pas aligner (comme "merge" = /mɛʁdʒ/, "Ghibli" = /gibli/), et des bugs d'alignement (désherbage). Mais ces derniers restent relativement rares quand même, vous en conviendrez.


sylvain

De: "SYLVAIN COULANGE" <sylvain....@univ-grenoble-alpes.fr>

À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Dimanche 24 Mai 2020 20:25:38

Robert JEANNARD

unread,
May 24, 2020, 3:02:47 PM5/24/20
to alem...@googlegroups.com
Bonsoir.
Super cette fonction d'ajout au dictionnaire !
J'ai fait pas mal d'essais, je n'ai pas trouvé beaucoup de problèmes.
En voici deux:
- Disparition systématique des traits d'union dans les mots composés.
- "Choisy-le-Roi" est transcrit Choisy-le-Roi.JPG (disparitinon du trait d'union, de la majuscule sur R et apparition d'une majuscule sur la dernière lettre.
A+
Robert

SYLVAIN COULANGE

unread,
May 24, 2020, 4:33:49 PM5/24/20
to Apprentissage des Langues Et Multimodalité, ALEM
Ahh très juste ! C'est un bug présent depuis longtemps !
Je vais voir ce que je peux faire.

Je vous explique en attendant :
- quand l'utilisateur appuie sur "Coloriser", le navigateur envoie une requête au serveur avec le texte à coloriser.
- la première chose que le serveur fait, c'est de découper le texte en mots : pour cela, j'utilise une librairie de traitement automatique de la langue (qui s'appelle spaCy) et qui découpe le texte selon la syntaxe française. Pour les tirets ça se passe comme ça :
→si le mot avec le tiret existe dans son dictionnaire (comme peut-être ou porte-feuille), il garde le mot entier "peut-être", ou "porte-feuille".
→s'il s'agit de deux mots "est-il", "année-là", "manges-en", il découpe sur le tiret pour avoir deux mots séparés par un tiret.
- ensuite il envoie chaque mot se faire coloriser un par un dans le script phon2graph, les tirets isolés restent gris.

Le problème c'est que phon2graph ne peut aligner que les lettres et l'apostrophe, et pas la ponctuation ou les tirets justement. Du coup je fais un prétraitement qui enlève tous les caractères qu'il ne peut pas gérer (espaces et tirets).
Il faudrait que je trouve un moyen de les remettre dans le résultat au bon endroit... pas évident. Merci de m'avoir rappelé le bug ! Je vais aussi essayer d'enlever les espaces en fonction de la ponctuation dans le résultat. C'est un chantier que j'avais laissé en plan.

sylvain





De: "Robert jeannard" <robert....@wanadoo.fr>

À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Dimanche 24 Mai 2020 21:02:08

Objet: Re: [ALEM] WikiColor : mots inconnus du dictionnaire & mots non alignables
Bonsoir.
Super cette fonction d'ajout au dictionnaire !
J'ai fait pas mal d'essais, je n'ai pas trouvé beaucoup de problèmes.
En voici deux:
- Disparition systématique des traits d'union dans les mots composés.
- "Choisy-le-Roi" est transcrit Choisy-le-Roi.JPG (disparitinon du trait d'union, de la majuscule sur R et apparition d'une majuscule sur la dernière lettre.
A+
Robert


Le dim. 24 mai 2020 à 18:40, SYLVAIN COULANGE <sylvain....@univ-grenoble-alpes.fr> a écrit :
Je vois déjà que certains d'entre vous on ajouté des mots ;)

Vous pouvez aussi ajouter plusieurs transcriptions possibles en même temps en les séparant par une virgule.


De: "SYLVAIN COULANGE" <sylvain....@univ-grenoble-alpes.fr>
À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Dimanche 24 Mai 2020 16:00:28
Objet: Re: [ALEM] WikiColor : mots inconnus du dictionnaire & mots non alignables

Hello !

J'ai ajouté la fonctionnalité sur WikiColor, selon les conseils d'Alexandre. Vous pouvez aussi ajouter le nouveau mot dans le dictionnaire (Enfin!).
Pour s'assurer que ça fonctionne, faites bien un ctrl+F5 pour recharger les styles de la page, après ce sera bon.

Je vous laisse tester et me dire si ça vous convient.

sylvain

--
Pour répondre à ce message, vous pouvez utiliser le bouton "Répondre" de votre messagerie.
Pour écrire sur un nouveau sujet, rendez-vous sur le forum : https://groups.google.com/d/forum/alem-app
---
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "Apprentissage des Langues Et Multimodalité (ALEM)".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse alem-app+u...@googlegroups.com.

Alexandre DO

unread,
May 30, 2020, 12:59:41 AM5/30/20
to Apprentissage des Langues et Multimodalité (ALEeM)
Bonjour,
J'ai rencontré ce problème avec un élève cette semaine, pour écrire 'est-que'.
Dans le résultat, 'est' est colorisé mais ensuite il y a un espace puis '-ce' reste gris.

La solution que j'ai trouvé pour que les deux mots soient colorés, c'est de mettre un espace avant et après le tiret.

En attendant mieux, ça peut être une solution.

Alexandre DO

unread,
May 30, 2020, 1:28:58 AM5/30/20
to Apprentissage des Langues et Multimodalité (ALEeM)
En relisant le fil de discussion, je vois que dans ton historique de bugs, il y avait 'de'.
Ça me fait penser que cette semaine j'ai dû faire des modifs dans le dictionnaire pour deux petits mots anodins qui fonctionnaient très bien avant.

Avant quoi ?

Je crois que c'était avant de rentrer un fidel avec tous les emprunts étrangers.

Comme j'étais en visio avec des élèves, je n'ai pas cherché trop longtemps.

Quand j'ai tapé une phrase qui le renvoyait une page d'erreurs en langage informatique, j'ai recommencé la phrase en faisant coloriser après la saisie de chaque mot afin d'identifier celui qui faisait bugger l'algo.

J'ai été surpris que ce soit sur deux mots très fréquents à 2 lettres.

Le premier, c'était 'tu'. Le 'nouveau'(?) dico proposait 2 ou 3 transcriptions. Je crois qu'il y avait /tsu/ et une autre avec un genre de vague comme pour les liaisons. J'ai supprimé celles qui n'étaient pas /ty/. Ça, c'était jeudi.

Hier, ça m'est arrivé avec 'de'. J'ai enlevé dans le dico des transcriptions. Je crois qu'il y avait /de/ et une autre en 2 syllabes.

Voilà pourquoi je pense que c'est depuis l'ajout d'un dico plus complet avec les emprunts étrangers ou autres transcriptions.

SYLVAIN COULANGE

unread,
May 30, 2020, 5:28:11 AM5/30/20
to Apprentissage des Langues Et Multimodalité, ALEM
Alexandre, tu confonds le dictionnaire avec le Fidel.

Concernant le Fidel, on a ajouté comme prévu une version "plus exhaustive" en intégrant le Fidel du Robert 2004. Ça permet de coloriser certains emprunts que le Fidel ne colorise que partiellement (pourquoi eux et pas d'autres?).

Concernant le dictionnaire, la dernière version (d'il y a 3 semaines) inclus toutes les variantes dialectales. Ainsi tu viens de supprimer le "tu" québécois.
Le problème c'est que le Fidel du Robert 2004 n'y suffit pas pour coloriser ces variantes.

Je serais d'avis de répertorier ces formes qui ne se colorent pas, et on ajoute les graphies dans le Fidel pour pouvoir les coloriser, plutôt que de les supprimer.
Si ça pose des problèmes à l'algo d'alignement (comme 'gl' pour /l/), on peut les désactiver temporairement.

Il vaut mieux éviter de supprimer des transcriptions du dico, c'est dommage.

sylvain


De: "Alexandre DO" <do.alex...@gmail.com>

À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Samedi 30 Mai 2020 07:28:58

Objet: Re: [ALEM] WikiColor : mots inconnus du dictionnaire & mots non alignables
--
Pour répondre à ce message, vous pouvez utiliser le bouton "Répondre" de votre messagerie.
Pour écrire sur un nouveau sujet, rendez-vous sur le forum : https://groups.google.com/d/forum/alem-app
---
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes Apprentissage des Langues et Multimodalité (ALEeM).

Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse alem-app+u...@googlegroups.com.

SYLVAIN COULANGE

unread,
May 30, 2020, 5:55:18 AM5/30/20
to Apprentissage des Langues Et Multimodalité, ALEM
On avait viré le /ts/ la dernière fois, mais voilà qu'il revient ;)

Comme le cas est simple (a priori), j'ai ajouté une règle à phon2graph, pour qu'il aligne /t/+/s/ si la transcription est 'ts', mais il reste possible d'aligner /ts/ si il n'y a que la lettre 't' d'alignable dans l'orthographe du mot (comme "tu").

tu viens - tu du Botswana ?

Je remets la transcription canadienne dans le dico.

La troisième transcription c'est pour TU (té u). Comme tous les sigles et accronymes que le Fidel ne peut pas aligner.
Le mieux est peut-être de regénérer un dictionnaire à partir du Wiktionnaire, sans prendre les pages de sigles et accronymes. Qu'en pensez-vous ?

Je remets que /t͡sy/.
J'ai enlevé aussi /de.y/ pour "du", comme il revient souvent.

sylvain

De: "SYLVAIN COULANGE" <sylvain....@univ-grenoble-alpes.fr>

À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Samedi 30 Mai 2020 11:28:10

Alexandre DO

unread,
May 30, 2020, 3:32:38 PM5/30/20
to alem...@googlegroups.com
Ah, désolé, je n'avais pas pensé à ça.
Je me disais que ce n'était pas la peine de te déranger pour ça et comme j'étais en cours, il fallait que je trouve une solution.
ça fait quand même un peu tâche quand ça plante sur des mots de 2 lettres.

Donc, maintenant, ça marche pour 'tu'. Est-ce que c'est parce que tu as rajouté des graphies dans le fidel en arrière plan ?
Ou parce que tu as modifié l'algo ?  Ou est-ce que c'est parce que tu as changé l'ordre des transcriptions ?

Il n'y a que dans ce dernier cas que je pourrais le faire directement, sinon, faudra te déranger.

ça risque quand même d'arriver souvent, non ? 

Dis-nous ce qu'il vaut mieux faire et peut-être qu'il faudra mettre des avertissements.

Heureusement que je me souvenais de ce que j'avais fait.

SYLVAIN COULANGE

unread,
May 30, 2020, 4:04:21 PM5/30/20
to Apprentissage des Langues Et Multimodalité, ALEM
oui comme je l'ai indiqué dans le message précédent, j'ai réactivé l'affriquée /ts/ dans l'aligneur, et j'ai ajouté une règle pour aligner en priorité /t/+/s/ quand c'est possible.
J'ai aussi ajouté la graphie t à /ts/ dans le Fidel. Je note toutes les modifs au fur et à mesure en expliquant pourquoi.

Il n'y a malheureusement rien que vous puissiez faire à ma place là, à moins de mettre les mains dans le code, synchroniser le répertoire gitlab, mettre à jour et redémarrer le serveur...


De: "Alexandre DO" <do.alex...@gmail.com>
À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Samedi 30 Mai 2020 21:32:03

Objet: Re: [ALEM] WikiColor : mots inconnus du dictionnaire & mots non alignables
--
Pour répondre à ce message, vous pouvez utiliser le bouton "Répondre" de votre messagerie.
Pour écrire sur un nouveau sujet, rendez-vous sur le forum : https://groups.google.com/d/forum/alem-app
---
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "Apprentissage des Langues et Multimodalité (ALEeM)".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse alem-app+u...@googlegroups.com.
Reply all
Reply to author
Forward
0 new messages