MissMDA, quali.sup, compete.Obs ou tab.dij ?

62 views
Skip to first unread message

montoy...@gmail.com

unread,
Apr 20, 2021, 11:48:08 AM4/20/21
to FactoMineR users
Bonjour,

Petite question concernant missMDA et les variables qualitatives supplémentaires.

J'ai imputé des données sur une base sur laquelle je veux réaliser une ACM avec deux variables qualitatives supplémentaires, j'ai donc utilisé le code suivant, celui-ci vous semble-t-il correct?


imp<-imputeMCA(d, ncp = 2, quali.sup = 2:3)

dmca<-MCA(d,  quali.sup = 2:3, tab.disj = imp$tab.disj)


J'ai par ailleurs utilisé plusieurs fois la librairie missMDA, et je ne comprends pas très bien la différence qu'il y a entre la réalisation de l'ACM sur le jeu de données complété ou sur le jeu de données plus le tableau disjonctif complété. Dans le cas présent j'ai testé avec la ligne de code suivante, et on obtient des résultats très similaires dans les deux cas, par exemple avec des différences > 0,1% sur le pourcentage des axes. 


d<-imp$completeObs

dmca1<-MCA(d, quali.sup = 2:3)


Quel le meilleur code? (et pourquoi?)



Merci d'avance pour vos commentaires et félicitations pour votre travail,


Victor







Francois Husson

unread,
Apr 26, 2021, 3:47:41 AM4/26/21
to factomin...@googlegroups.com
Bonjour,

Oui votre code est correct pour faire l'imputation par ACM puis l'ACM. Vous pouvez utiliser le package Factoshiny, qui fera tout automatiquement et vous redonnera les lignes de code. Voir par exemple : https://youtu.be/mUKz4L2ZsuY

Pour le package missMDA et l'ACM sur le jeu imputé et sur le tableau disjonctif imputé, les résultats sont proches, c'est normal. La différence est qu'avec le tableau disjonctif imputé, on garde l'incertitude sur la modalité qui est choisie en ayant des valeurs réelles comprises entre 0 et 1, valeurs qui peuvent être vues comme des probabilité d'appartenance de l'individu à cette modalité. C'est donc plus juste de travailler avec le tableau disjonctif imputé. MAis si vous avez une grosse base de données, revenir à des valeurs imputées et faire l'ACM donnera à peu près les mêmes résultats.

FH
--
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "FactoMineR users".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse factominer-use...@googlegroups.com.
Cette discussion peut être lue sur le Web à l'adresse https://groups.google.com/d/msgid/factominer-users/02e770ee-9926-4e4c-833d-494fe58b66dbn%40googlegroups.com.

--
Francois Husson
Department Statistics & Computer science
L'Institut Agro - AGROCAMPUS OUEST
65 rue de St-Brieuc - 35042 RENNES
Tel: +33 2 23 48 58 86
https://husson.github.io

Victor Montoya

unread,
Apr 27, 2021, 9:33:54 AM4/27/21
to factomin...@googlegroups.com
Bonjour,

Merci de votre réponse. Mon jeu de donné est relativement petit (je pense) puisqu’il ne contient que 156 individus et 29 variables (je travaille sur des pays, donc ces 156 individus représentent la totalité de la population).

Je constate que lorsque l’on réalise l’ACM avec le tableau disjonctif, le nom de certaines variables change: au lieu du nom, c’est le numéro qui apparait. J’arrive à rajouter le nom mais pas à éliminer le numero, ce qui surcharge le graphique. Je suppose qu’il vaut mieux préférer la rigueur à l’esthétique.

Merci beaucoup

Victor

Francois Husson

unread,
Apr 28, 2021, 4:47:41 AM4/28/21
to factomin...@googlegroups.com
Bonjour,
Quand 2 modalités de différentes variables ont le même nom, alors un nouveau nom est donné aux modalités en concaténant nomvariable_nommodalité.
L'esthétique est importante dans les graphes, donc n'hésitez pas à modifier le nom de vos modalités.

FH

Victor Montoya

unread,
Apr 29, 2021, 1:49:54 PM4/29/21
to factomin...@googlegroups.com
Bonjour,

Merci de votre réponse. Effectivement, j’ai plusieurs variables qui ont le même nom pour les modalités. Ce sont des variables ordinales que j’ai découpé en catégories. Au lieu de mettre le détail du découpage (par exemple, pour la variable P.I.B.,  +3%, 2/3%, etc), j’ai mis des lettres (A, B, etc.). Ceci est très pratique puisqu’il suffit de jeter un coup au nuage des modalités pour se rendre compte que pour ces variables, les modalités A et B s’opposent presque systématiquement aux modalités D/E. Ce codage était donc destiné à faciliter la lecture du graphique.

J’ai trouvé une solution artisanale: j'améliore le graphe avec un logiciel d’édition d’image.

Merci à vous,

Victor

Reply all
Reply to author
Forward
0 new messages