Problème rencontré avec HCPC et consol=T

674 views
Skip to first unread message

Bérengère

unread,
Sep 13, 2012, 9:42:12 AM9/13/12
to factomin...@googlegroups.com
Bonjour,

Je réalise une CAH avec méthode de Ward à partir des coordonnées factorielles issues d'une ACP normée. Mon problème est le suivant:

 Si j'utilise la fonction HCPC avec consol=T (le défaut), les clusters que j'observe sur le graphique "Hierarchical Clustering" ne sont pas les mêmes que ceux que j' observe sur les 2 graphiques "Factor map" et "Hierarchical clustering on the factor map" (cf. fichier joint) et la variable qui donne la partition (HCPCfemur$data.clust$clust dans mon code ci-dessous) correspond, aux clusters observés sur les 2 graphiques "Factor map" et "Hierachical clustering on the factor map". La caractérisation des classes, la liste des parangons et des individus spécifiques de chaque classe sont par ailleurs faites en utilisant cette variable.

En revanche lorsque je mets l'argument consol à FALSE, les clusters observés sur les 3 graphiques sont strictement composés des mêmes individus.

library(FactoMineR)
femursc<-subset(femursexeconnu,select=c(resFM2,resFM6,resFM7,resFM8,resFM9,resFM10,hommeDS,gp));
ACPfemur4cp=PCA(femursc,scale.unit=T,ncp=4,quali.sup=7:8,graph=F); #on choisit de ne conserver que les 4 premières CP
#Avec consol=T, on observe sur les 3 graphiques générés par HCPC des clusters différents
HCPCfemur=HCPC(ACPfemur4cp,method="ward",nb.clust=-1)

#effectifs par cluster
table(HCPCfemur$data.clust$clust)
Pourriez-vous, s'il vous plaît, me dire, pourquoi, avec consol=T, j'observe des clusters qui diffèrent entre les graphiques générés par HCPC et si, selon vous, il est préférable de désactiver cette option?

En vous remerciant très sincèrement pour votre aide,

Bérengère
les 3 graphiques de HCPC avec consol=T.doc

François Husson

unread,
Sep 13, 2012, 9:58:47 AM9/13/12
to factomin...@googlegroups.com
Bonjour,

La fonction HCPC permet de construire une classification hiérarchique. Une fois cet arbre construit, la fonction propose de couper l'arbre pour construire des classes. Jusque là, il y a donc correspondances entre l'arbre hiérarchique et les classes construites. Ensuite, la fonction propose de consolider les classes. Cela permet d'avoir des classes plus homogène MAIS la hiérarchie est perdue. Il n'y a donc plus correspondance entre l'arbre hiérarchique et les classes obtenues après consolidation : certains individus ont changé de classe.
Donc si vous voulez une correspondance entre arbre et classes, il faut utiliser consol=FALSE. Vos classes sont un peu moins homogènes mais vous gardez l'aspect hiérarchique.

FH

Bérengère

unread,
Sep 14, 2012, 4:56:29 AM9/14/12
to factomin...@googlegroups.com
 
Bonjour,
 
Je vous remercie infiniment pour ces éclaircissements.
 
Bien cordialement,
 
Bérengère

tine

unread,
Jul 30, 2013, 10:32:13 AM7/30/13
to factomin...@googlegroups.com
Bonjour,
 
J'aimerais bien trouver quelques explications par rapport à cette fonction (consol) que j'hésite d'utiliser dans le cadre de ma thèse (en sciences politiques)
J'ai bien compris qu'il s'agit d'une consolidation des classes à l'aide d'un algorithme k-means.
Par contre si je comprends bien, en procèdent ainsi il n'y a pas seulement des individus qui changent de classe mais également les centres des classes qui bougent. Ai-je bien compris?
Et combien de fois cet algorithme est appliqué?
 
Et si cela est le cas je ne comprends pas exactement comment je pourrais interpréter mes classes. Est-ce qu'il existe de la littérature sur la question (ou un exemple) ??? J'ai essayé de trouves des explication en ligne (en français, anglais et allemand) sans succès.
 
Je vous remercie d'avance!!!! 
 
Tinette

Le jeudi 13 septembre 2012 15:58:47 UTC+2, François Husson a écrit :

Julie Josse

unread,
Jul 30, 2013, 11:16:43 AM7/30/13
to factomin...@googlegroups.com
Bonjour,

Deux références:
Ludovic lebart: statistique exploratoire multidimensionnelle (chapitre classification mixte, consolidation)
husson- pages -le: analyse des données avec R,

L'idée est bien 1) faire une CAH; 2) couper l'arbre ce qui définit des classes 3) Le centre de ces classes sert de points de départ aux kmeans. Donc la classification obtenue sera différente de celle obtenue par l'arbre mais il n'y aura pas de grands changements (oui des individus et le centre des classes vont bien bouger).

Bien cordialement,
J. josse
--
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes FactoMineR users.
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse factominer-use...@googlegroups.com.
Pour plus d'options, visitez le site https://groups.google.com/groups/opt_out .
 
 

tine

unread,
Aug 5, 2013, 8:07:32 AM8/5/13
to factomin...@googlegroups.com
Merci beaucoup pour ces explications!
 
Je vais également regarder dans les deux livres.
 
Tinette
 

Le jeudi 13 septembre 2012 15:42:12 UTC+2, Bérengère a écrit :
Message has been deleted

Rmy

unread,
Dec 11, 2014, 10:49:45 AM12/11/14
to factomin...@googlegroups.com
Bonjour,
Merci pour cette information car je suis en effet tombé sur le même problème. Cela dit, est-il possible de conserver les deux graphiques permettant de coloriser les point de l'APC selon les groupes de la CAH ("Factor map" et "Hierachical clustering on the factor map"), tout en utilisant le consol=FALSE ?

Merci d'avance!


Le jeudi 13 septembre 2012 15:58:47 UTC+2, François Husson a écrit :
Reply all
Reply to author
Forward
0 new messages