Question2 tp4, Mot out of vocabulary

19 views
Skip to first unread message

Alexandre Huot

unread,
Jul 22, 2013, 8:53:40 PM7/22/13
to ift-61...@googlegroups.com
Bonjour, tout mes fonctions de prétraitement du vocabulaire et du compte de mot et entrainer fonctionnent.

Test de creerVocabulaire (RÉUSSI)

Test de pretraiter (RÉUSSI)

Test de entrainer (RÉUSSI)

mon probleme c'est que dans le fonction prédire j'ai un Key error 

self.freqWC[W,C]
KeyError: ('dabhol', 0)

Je ne comprend pas pourquoi soit dabhol n'est pas remplacer par OOV ou pourquoi dabhol n'as pas de frequence calculé. Je me dit que si mes autres fonctions fonctionnent, je ne voit pas qu'est-ce qui peut causer ce problème


Merci

Hugo Larochelle

unread,
Jul 22, 2013, 8:57:34 PM7/22/13
to Alexandre Huot, ift-61...@googlegroups.com
... moi non plus :-)  Tu dois avoir un bug dans ton code, mais qui n'est pas identifié par les "test cases" que je fournis...

Hugo


2013/7/22 Alexandre Huot <alexh...@gmail.com>

--
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes IFT 615 E2013.
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse ift-615-e201...@googlegroups.com.
Pour plus d'options, visitez le site https://groups.google.com/groups/opt_out .
 
 

Alexandre Huot

unread,
Jul 22, 2013, 9:36:30 PM7/22/13
to ift-61...@googlegroups.com, Alexandre Huot
Merci pour la réponse rapide, c'est apprécié!

J'ai retravailler un bout de mon code louche et ca semble marcher maintenant.

Par contre j'ai ceci comme résultat:

Création du vocabulaire
Prétraitement des corpus
Entraînement et prédiction
Erreur de classification sur ensemble d'entraînement (5857 items): 1.2464%
Erreur de classification sur ensemble de test (5172 items): 7.7533%


Test de creerVocabulaire (RÉUSSI)
Test de pretraiter (RÉUSSI)
Test de entrainer (RÉUSSI)

Test de predire (RÉUSSI)

Le pourcentage d'erreur ça veut dire quoi?! Est-ce que c'est bon?? Mes pourcentages d'erreurs sont calculé par quelle fonction et sur quoi devrais-je travailler pour les améliorer?! 

Merci!

Hugo Larochelle

unread,
Jul 22, 2013, 9:56:45 PM7/22/13
to Alexandre Huot, ift-61...@googlegroups.com
C'est le pourcentage d'erreur de classification, sur l'ensemble d'entraînement et sur celui de test.

C'est normal que l'erreur ne soit pas de 0. Par exemple, votre détecteur de pourriels fait des erreurs parfois... Avoir une erreur de 0 sur l'ensemble de test est très souvent impossible, sauf pour des problèmes simples...

Hugo
Reply all
Reply to author
Forward
0 new messages