Deux problèmes dans GrammaChrome

16 views
Skip to first unread message

Robert Jeannard

unread,
Sep 11, 2022, 11:02:13 AM9/11/22
to Apprentissage des Langues et Multimodalité (ALeM)
Bonjour Sylvain.

Je n'ai pas encore utilisé GrammaChrome.
Je viens de faire quelques essais, il me semble qu'il fonctionne bien, sauf un bug pour la colorisation des interjections: il les colorise en marron comme les pronoms.
 Par ailleurs, dans la présentation de l'outil, il est écrit :
  • Dans la première phrase: "Les couleurs utilisées sont inspirées de la Grammaire en Couleurs de Maurice Laurent, qui a conçu un tableau de grammaire muet..."
  • en surimpression de l'aperçu du panneau grammatical de Maurice et Christiane Laurent: Grammachrome.jpg"Aperçu du tableau avec des exemples de mots à l'intérieur"
Les 2 mots "tableau" et "mot" que j'ai surlignés posent problème:
  • Maurice a nommé son outil "Panneau muet des catégories de mots" et non "tableau". Je pense que nous ne devrions pas changer la dénomination.
  • Les exemples du panneau rempli ne sont pas toujours des mots entiers mais souvent des terminaisons. Il vaudrait mieux reformuler:  "Aperçu du panneau avec des exemples de terminaisons ou de mots à l'intérieur".

SYLVAIN COULANGE

unread,
Sep 12, 2022, 3:35:22 AM9/12/22
to Apprentissage des Langues Et Multimodalité, ALEM
Merci beaucoup Robert pour ce retour.

Je viens de modifier la page de présentation, tu as raison j'ai interchangé panneau et tableau à plusieurs endroits. N'hésite pas à faire remonter ce genre d'observations.
Cela me rappelle qu'il faut impérativement que nous mettions à jour ce carnet hypothèse. Il y a beaucoup de nouveautés dans les applications dont nous ne parlons pas encore...

Quant aux interjections, elles sont bien colorées en gris (comme c'est indiqué et personnalisable en cliquant sur le bouton ). Mais les catégories grammaticales sont déterminées par un modèle statistique qui a été entraîné à prédire la catégorie des mots en contexte (ex. "est" peut être un nom, un verbe, un auxiliaire...). Quand on passe le curseur de la souris sur les mots colorés, on peut voir la catégorie et les traits grammaticaux que le modèle a attribué à chaque mot, et parfois ce ne sont pas les bonnes ; surtout si la phrase est agrammaticale... Effectivement, dans beaucoup de cas, les interjections sont prises pour des noms propre, voire de la ponctuation...

Il faudrait que je vois si les derniers modèles sont plus performants, et le cas échéant, je mettrai à jour Grammachrome. J'aimerais également ajouter l'anglais. Et il faut que je retravaille le mandarin, dont les résultats sont vraiment pas extraordinaires.

Sinon, une solution de dépannage un peu "brutale" serait de contraindre la catégorisation d'une liste de mots, par exemple ah, aah, aïe, ouïe... en "interjection". Ça peut marcher s'il n'y a pas d'ambiguïté. Le problème c'est que "ouïe" ici, ne pourrait plus être considéré comme un participe passé ni comme un nom... Pour ah, aah et aïe, a priori ça ne poserait pas problème.

C'est un grand sujet de discussion que j'aimerais avoir avec vous, chers collègues.
Comment faire lorsque la machine se trompe ? Je ne sais pas si vous avez essayé des phrases agrammaticales, ou avec des fautes, les résultats en pâtissent largement...

sylvain


De: "Robert Jeannard" <robert....@gmail.com>
À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Dimanche 11 Septembre 2022 17:02:13
Objet: [ALeM] Deux problèmes dans GrammaChrome

--
Pour répondre à ce message, vous pouvez utiliser le bouton "Répondre" de votre messagerie.
Pour écrire sur un nouveau sujet, rendez-vous sur le forum : https://groups.google.com/d/forum/alem-app
---
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "Apprentissage des Langues et Multimodalité (ALeM)".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse alem-app+u...@googlegroups.com.
Cette discussion peut être lue sur le Web à l'adresse https://groups.google.com/d/msgid/alem-app/9cb8abce-6128-43cd-adff-f0e91479bab8n%40googlegroups.com.

Robert Jeannard

unread,
Sep 12, 2022, 11:51:07 AM9/12/22
to Apprentissage des Langues et Multimodalité (ALeM)
Bonjour Sylvain.

J'ai refait quelques essais avec des interjections dans des phrases bien grammaticales, mais le bug demeure:
Sans titre.jpg Analyse de "Ah" comme nom propre, mais couleur du pronom = double erreur.
Sans titre.jpg Même analyse.
Sans titre.jpg Même analyse: "Bravo" catégorisé "nom propre et colorisé comme un pronom.
Sans titre.jpgMême analyse, même quand "bravo" est écrit avec une minuscule à l'initiale.
Autres exemples d'erreurs sur l'interjection:
Sans titre.jpg L'interjection est  catégorisée comme adjectif.
Sans titre.jpg  L'interjection est  catégorisée comme nom.

Erreurs portant sur d'autres catégories:
Sans titre.jpg "belle" est catégorisé comme adjectif bien que précédé d'un déterminant.
Sans titre.jpg "cause" est catégorisé comme adjectif.
Sans titre.jpg "cause" est catégorisé comme nom, "de la" n'est pas reconnu comme partitif.
Sans titre.jpg "Le verbe "calme" est catégorisé comme adjectif.

Bref, il reste du chemin à parcourir. 


Pour voir ce qui se fait ailleurs, je signale l'outil "Lecteur immersif" de Microsoft (accessible avec un compte Microsoft et un abonnement à Office 365, gratuit pour les enseignants), qui propose lui aussi la catégorisation grammaticale par colorisation mais n'a retenu que 4 catégories, choix discutable mais peut-être défendable, l'objectif de l'application étant de faciliter la lecture.
La colorisation est activable séparément pour chaque catégorie au choix du lecteur, ainsi que l'affichage des étiquettes. 
Sans titre.jpg
Exemple de texte colorisé dans le lecteur immersif:
Sans titre.jpg
Il y a comme vous le voyez plusieurs erreurs: "in" catégorisé comme adjectif, "New" catégorisé comme adjectif dans "New-York", "l'angoisse" traité comme un seul mot.

Robert

Le lundi 12 septembre 2022 à 11:35:22 UTC+4, SYLVAIN COULANGE a écrit :
Merci beaucoup Robert pour ce retour. [...]
Quant aux interjections, elles sont bien colorées en gris (comme c'est indiqué et personnalisable en cliquant sur le bouton ). Mais les catégories grammaticales sont déterminées par un modèle statistique qui a été entraîné à prédire la catégorie des mots en contexte (ex. "est" peut être un nom, un verbe, un auxiliaire...). Quand on passe le curseur de la souris sur les mots colorés, on peut voir la catégorie et les traits grammaticaux que le modèle a attribué à chaque mot, et parfois ce ne sont pas les bonnes ; surtout si la phrase est agrammaticale... Effectivement, dans beaucoup de cas, les interjections sont prises pour des noms propres, voire de la ponctuation...

Il faudrait que je voie si les derniers modèles sont plus performants, et le cas échéant, je mettrai à jour Grammachrome. J'aimerais également ajouter l'anglais. Et il faut que je retravaille le mandarin, dont les résultats sont vraiment pas extraordinaires.

SYLVAIN COULANGE

unread,
Sep 12, 2022, 12:15:55 PM9/12/22
to Apprentissage des Langues Et Multimodalité, ALEM
Merci Robert pour ces compléments.

Oups! je pensais que les noms propres se pointaient dans le marron ! Je viens de vérifier auprès de Françoise qui me confirme effectivement que c'est dans les verts....
Après 2 ans de service de GrammaChrome, on dirait que ça n'a pas posé problème à grand monde :) (ou bien personne ne l'utilise, ce qui est plus probable)
Je change ça très vite.

Le lecteur immersif de Microsoft utilise certainement un modèle similaire à GrammaChrome, mais probablement un modèle de chez eux. Mais c'est le même principe : il prend la catégorie qu'il juge la plus probable étant donné le mot et le contexte. Ce sont des statistiques, donc ce n'est jamais parfait. On peut alors à juste titre se demander jusqu'où on peut se permettre d'avoir un outil qui se trompe. C'est un vrai problème en informatique pour l'apprentissage des langues. Le cas est plus flagrant ici que sur Wikicolor, car la phono est moins ambigüe en terme de règles (même s'il fait quand même des erreurs...).

J'espère que le prochain modèle fera moins d'erreurs. On pourra retester ces phrases pour voir s'il y a une différence.

sylvain


De: "Robert Jeannard" <robert....@gmail.com>
À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Lundi 12 Septembre 2022 17:51:06
Objet: Re: [ALeM] Erreurs de colorisation dans GrammaChrome

--
Pour répondre à ce message, vous pouvez utiliser le bouton "Répondre" de votre messagerie.
Pour écrire sur un nouveau sujet, rendez-vous sur le forum : https://groups.google.com/d/forum/alem-app
---
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "Apprentissage des Langues et Multimodalité (ALeM)".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse alem-app+u...@googlegroups.com.

SYLVAIN COULANGE

unread,
Sep 25, 2022, 11:52:01 AM9/25/22
to Apprentissage des Langues Et Multimodalité, ALEM
Bonjour à tous !

j'écris enfin un message sur le forum pour signaler que j'ai mis à jour GrammaChrome.
Pas de grosses différences avec la version antérieure malheureusement. Les modèles de langue sont les derniers disponibles, mais la qualité de l'analyse grammaticale statistique n'est pas vraiment meilleure.
C'est toujours pour la langue orale que ça pêche, sans surprise puisque les modèles sont appris sur des corpus de textes divers mais de langue majoritairement écrite (presse, littérature, encyclopédies).

J'ai ajouté un module permettant de forcer la couleur de certains mots (pour résoudre le problème des interjections). Pour l'instant, il n'y a pas de règle particulière : si le programme voit "aah", il mettra systématiquement la couleur de l'interjection. Mais il y a beaucoup de cas ambigus comme "bonjour" ou "salut", pour lesquels on ne peut pas se permettre un fonctionnement si simple.
Il est tout à fait possible de créer une suite de règles "à l'ancienne" pour contraindre la colorisation. Par ex. si précédé d'un déterminant, "bonjour" devient un nom. Mais il faudrait réussir à prévoir "tous" les cas possibles.

En tout cas je pense que c'est une étape nécessaire si on veut que GrammaChrome soit utilisable dans un contexte d'apprentissage d'une langue.
Il faudrait aussi considérer certaines expressions comme "à côté de" etc. comme locution prépositive (couleur préposition pour les trois mots)...

N'hésitez pas à faire remonter des problèmes, et éventuellement suggérer des règles de correction.
J'aimerais sérieusement commencer à réfléchir à des applications didactiques de GrammaChrome. Je pense à des activités fermées du type PhonoPlayer, mais beaucoup d'autres choses sont possibles. Si vous avez des idées, et si vous souhaitez collaborer, ce serait un grand plaisir !

sylvain

PS. j'ai ajouté la colorisation de l'anglais. Je peux le faire "assez facilement" pour un grand nombre de langues, toutes les langues dont l'analyseur morphosyntaxique propose un modèle (liste ici). Si vous avez des besoins particuliers, dites-moi !

PPS.C'était déjà le cas avant, mais vous pouvez directement copier coller le texte depuis la page de colorisation.


De: "SYLVAIN COULANGE" <sylvain....@univ-grenoble-alpes.fr>

À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Lundi 12 Septembre 2022 18:15:51

Robert Jeannard

unread,
Sep 25, 2022, 4:55:35 PM9/25/22
to alem...@googlegroups.com
Bonsoir Sylvain et tout le monde.

Merci Sylvain pour cette mise à jour, effectivement, c'est mieux maintenant pour les interjections.
Comme tu l'expliques, le nombre d'erreurs reste important.
Pour une phrase ambigüe comme "La belle porte le voile" (2 interprétations possibles), la colorisation donne 
image.png
déterminant + adjectif + verbe + déterminant + nom, une configuration syntaxique impossible.
Les 2 configurations possibles seraient:
  1. Déterminant + nom + verbe + déterminant + nom
  2. Déterminant + adjectif + nom + pronom + verbe
Je peux accepter que le système choisisse une des 2 interprétations, mais pas la configuration syntaxique impossible déterminant + adjectif + verbe.
Je propose qu'il soit possible à l'utilisateur, comme dans les traductions DeepL, d'intervenir pour corriger le résultat en modifiant un élément de celui-ci et que le système corrige le reste en cohérence avec la modification. Est-ce trop demander ?

Une autre réflexion, pédagogique celle-là, sur l'utilité de l'analyse grammaticale par catégories de mots dans les langues autres que le français.
Cette utilité me semble forte en français pour l'orthographe grammaticale (accords qui se marquent à l'écrit mais ne s'entendent pas à l'oral) mais pas dans la majorité des langues. En anglais par exemple, les accords sont beaucoup moins nombreux qu'en français et ils s'entendent. Dans les langues romanes autres que le français, ils sont aussi nombreux mais s'entendent toujours et ne posent pas de problème pédagogique lors de l'entrée dans l'écrit. Ce n'est pas un hasard si la tradition scolaire des pays francophones accorde une place si importante à la grammaire en comparaison avec celles des autres pays.

Robert

Emilie Thillou

unread,
Sep 26, 2022, 2:51:50 AM9/26/22
to Apprentissage des Langues et Multimodalité (ALeM)
Bonjour

Je suis d'un peu loin les développements de tes applis, Sylvain. Mais je suis persuadée que pour l'anglais, GrammaChrome me serait utile pour les étudiants qui préparent le TOEIC. Il y a plein de questions dans le TOEIC portant sur un choix grammatical entre adjectif/adverbe/nom/verbe et je me rends compte que c'est la partie du test où les étudiants pataugent le plus. Il y a donc sûrement des activités à créer autour de ça, avec GrammaChrome comme feedback, pour donner l'autonomie aux étudiants.... je vais laisser mûrir cette idée mais si quelqu'un souhaite collaborer, ce serait avec plaisir.

A bientôt
Emilie

SYLVAIN COULANGE

unread,
Sep 26, 2022, 6:24:49 AM9/26/22
to Apprentissage des Langues Et Multimodalité, ALEM
Merci pour vos retours !

@Robert, contraindre le système par des gabarits syntaxiques "grammaticaux", et ainsi filtrer tous les gabarits impossibles, me semble une bonne idée en effet. La difficulté étant de pouvoir lister l'ensemble des gabarits possibles (ou impossibles en fonction de ce qui est le plus simple). À court terme ou pourrait simplement permettre à l'utilisateur d'ajouter des gabarits impossibles, comme tu viens de le faire, mais je ne vois pas comment corriger l'erreur du système. Ce que je peux faire, c'est lister des cas d'erreur et indiquer la correction à faire (ex. SI déterminant + adjectif + verbe + déterminant + nom →ALORS changer l'adjectif en nom) Mais vous conviendrez que ça ne convrira qu'un nombre bien limité de cas, et que dans certains cas, cela pourrait engendrer des surcorrections qui ne seraient pas souhaitées.
En tout cas c'est une piste, Robert. Permettre aux utilisateurs de suggérer eux-mêmes leurs corrections est une bonne idée pour ne pas avoir à prévoir tous les cas de figure en amont ; le risque étant d'avoir des règles qui se contredisent, voire des règles incorrectes...

@Émilie, super ! N'hésite pas à me faire remonter les grosses erreurs sur l'anglais, comme Robert en français. On pourra voir de quelle manière "corriger" le problème.

Dans tous les cas, un café ALeM dédié à la grammaire autour de GrammaChrome me semble une idée intéressante, pas vous ?

sylvain



De: "Emilie Thillou" <emilie....@gmail.com>

À: "Apprentissage des Langues Et Multimodalité, ALEM" <alem...@googlegroups.com>
Envoyé: Lundi 26 Septembre 2022 08:51:50
--
Pour répondre à ce message, vous pouvez utiliser le bouton "Répondre" de votre messagerie.
Pour écrire sur un nouveau sujet, rendez-vous sur le forum : https://groups.google.com/d/forum/alem-app
---
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "Apprentissage des Langues et Multimodalité (ALeM)".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse alem-app+u...@googlegroups.com.
Reply all
Reply to author
Forward
0 new messages