Discordance du Chi2 en utilisant catdes() et chisq.test()

38 views
Skip to first unread message

Arnaud Dallongeville

unread,
Jun 25, 2023, 7:51:06 AM6/25/23
to FactoMineR users
Bonjour,

Je rencontre un problème qui vient probablement de ma mauvaise compréhension de la fonction catdes(), et je me permets de solliciter votre aide.

Je travaille sur un dataframe de 77 individus, comprenant 38 variables qualitatives (à 2 ou 3 modalités) et 15 variables quantitatives.

J'utilise la fonction catdes() pour étudier une à une 6 variables qualitatives d'intérêt, en fixant l'argument proba à 0.1.

Dans la première partie de la sortie de la fonction ( Link between the cluster variable and the categorical variables (chi-square test))  j'obtiens (si je comprends bien) une liste des variables qualitatives dont la p-value pour le test de Khi 2 est inférieure à 0.1, donc des variables non indépendantes de ma variable d'intérêt.

Or, si j'utilise la fonction chisq.test() sur certaines variables ne figurant pas dans la sortie de catdes(), j'obtiens pour certaines une pvalue inférieure à 0.1. Ce sont d'ailleurs des variables dont certaines apparaissent ensuite dans la description des clusters par catégorie.

Inversement, pour certaines variables qui apparaissent en résultat de catdes() avec une pvalue inférieure à 0.1, lorsque j'utilise la fonction chisq.test(), le pvalue est différente et n'est pas significative.

Pouvez-vous m'éclairer sur l'origine de ces discordances, afin de pouvoir interpréter au mieux mes résultats ?

Merci d'avance pour votre aide !

Arnaud D.


Francois Husson

unread,
Jun 26, 2023, 1:52:33 PM6/26/23
to factomin...@googlegroups.com
Bonjour,
C'est bien un test du chi² avec chisq.test qui est fait dans catdes. Donc il doit y avoir total cohérence dans les résultats.
Pouvez-vous vérifier, et si le pb persiste m'envoyer vos données (anonymisées éventuellement), ainsi que les lignes de code permettant de mettre en avant le pb.
FH
--
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "FactoMineR users".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse factominer-use...@googlegroups.com.
Cette discussion peut être lue sur le Web à l'adresse https://groups.google.com/d/msgid/factominer-users/90cd471b-9f35-48fc-8740-19c87adc1cf7n%40googlegroups.com.

--
Logo signature e-mail
François Husson
Department Statistics & Computer science
UMR 6625 IRMAR CNRS
65 rue de Saint-Brieuc, CS 84215, 35042 Rennes Cedex
Tel: +33 2 23 48 58 86
https://husson.github.io
En 2022, Agrocampus Ouest devient l'Institut Agro Rennes-Angers.

Arnaud Dallongeville

unread,
Jun 26, 2023, 3:44:30 PM6/26/23
to FactoMineR users
Bonjour,

Merci beaucoup pour votre retour rapide !

Est-ce que je peux, au besoin, vous envoyer les données par mail ?

Merci encore pour votre aide,

Arnaud D.

Francois Husson

unread,
Jun 27, 2023, 2:12:28 PM6/27/23
to factomin...@googlegroups.com
Bonjour,
A mon avis vous n'êtes pas sur la bonne variable avec catdes car la variable tbm_distension a 3 modalités et eosino 5 alors que dans la table il n'y a que 3 et 2 modalités.
Envoyez-moi votre jeu de données par mail, mais vérifiez que votre variable 40 est bien celle qui vous intéresse.
FH
Reply all
Reply to author
Forward
0 new messages