Bonjour,
Tout d'abord un très grand merci d'avoir créé ce package FactoMineR pour l'analyse multifatcorielle. Il m'a été très utile jusqu'ici, mais je rencontre un problème d'ordre méthodologique.
J'essaye d'appliquer l'ACM sur un jeu de données longitudinales. Jusqu'ici, j'avais séparé mon jeu de données en plusieurs clusters en fonction des périodes (mettons années 1910, 1920, 1930...) et appliqué une ACM sur chaque partition. J'ai pu remarquer que plus le jeu de données est grand, plus la position des variables actives reste stable d'une partition (i.e. d'une période) à l'autre. À l'inverse, plus le jeu de données est petit, moins les dimensions restent stables. Mon but est d'observer le changement de profil pour chaque modalité d'une variable qualitative supplémentaire au cours du temps. Pour ce faire, j'extrais les coordonnées des points des variables actives et de la variable supplémentaire et je visualise les changements dans un graphique dynamique (package: googleVis).
Ma question est la suivante: comment faire en sorte que les coordonnées des modalités des variables actives restent stables pour chaque partition et que les coordonnées des modalités de la variable supplémentaire puissent se mouvoir, si le jeu de données n'est pas suffisamment grand? Je pensais exploiter une propriété des variables supplémentaires, à savoir que les coordonnées de leurs modalités sont calculées par la moyenne pondérée des coordonnées des points des individus (arrêtez-moi si je me trompe). Donc, au lieu de créer un biplot pour chaque période étudiée, l'idée serait de créer un seul biplot "panchronique" afin de stabiliser les dimensions, puis de projeter les modalités de la variable supplémentaire pour chaque période.
Exemple: pour les années 1910:
- créer une ACM sur base des variables actives de tout le jeu de données;
- extraire les coordonnées des individus pour cette période;
- si la variable supplémentaire a les modalités A, B et C, subdiviser les coordonnées en trois selon ces modalités;
- enfin, calculer les coordonnées de chaque modalité en calculant la moyenne pondérée des points qui les définissent.
Il suffirait ensuite d'appliquer cette procédure à chaque partition/période. Je voudrais savoir si cela a déjà été étudié ou s'il existe une procédure pour stabiliser les dimensions pour des études longitudinales. Je ne suis pas statisticien, donc si quelqu'un pouvait m'éclairer sur comment les moyennes pondérées sont calculées, je lui en serais reconnaissant.
D'avance merci!