HCPC, decoupage en classe et econometrie

286 views
Skip to first unread message

Elena Stolyarova

unread,
Jul 10, 2012, 4:54:13 AM7/10/12
to factomin...@googlegroups.com
Bonjour, 

Je voulais tout d'abord pour l'excellent Package que vous avez fait et pour le livre sur l'analyse des données. Cela m'a été utile plus d'une fois!

Actuellement je travaille sur l'économétrie de panel avec l'échantillon des données quantitatives disponibles pour 100 pays. Ayant des difficultés pour composé des groupes des pays plus au moins homogènes, je me suis tourné finalement vers ACP, ACM et HCPC.  J'aimerais avoir votre avis si possible et j'ai quelques questions.

Mes questions sont:
- Découpage en classe des variables quantitatives en utilisant HCPC de factoMineR ne marche pas sur les nouvelles version de R (le problème d'HCPC qui a été déjà signalé sur se groupe).  Y a-t-il une autre méthode, programme, package qui donne les mêmes résultats en utilisant la méthode K-mean?
- Mes variables quantitatives sont assez différentes, certaines sont comprises entre 0 et 1 (%), d'autres peuvent monter jusqu'à plusieurs milliards. Je me suis dit qu'utiliser ces variables brutes pour faire ACP ne sera pas raisonnable, ai-je raison? Peut-on harmoniser les variables? Pour le moment j'ai coupé les variables en 4 modalités selon les quartiles, transformant ainsi ma base en base des variables quantitatives.
- Comme il s'agit des pays et de la macroéconomie, les caractéristiques des pays changent au cours du temps. Pour le moment j'ai fait 3 ACM pour les années 1980, 1990, 2004 et 2008. Est-ce qu'il y a un sens pour comparer les résultats d'ACM des différents années, ainsi que les classes obtenues grâce à l'HCPC? Peut-être il y a une méthode plus appropriée?

Je sais que les économètres utilise analyse des données pour construire les testes économétriques (les testes de racine unitaire), peut-être avez vous les noms des chercheurs à conseiller ou les articles à lire?

En tout cas je vous remercie à l'avance pour toute réponse.

Elena Stolyarova 


François Husson

unread,
Jul 10, 2012, 5:12:30 AM7/10/12
to factomin...@googlegroups.com
Bonjour,

Merci pour vos commentaires sur le package et le livre. Je réponds à vos questions au fur et à mesure :
- Découpage en classe des variables quantitatives en utilisant HCPC de factoMineR: essayer de réinstaller une nouvelle version de R. Je crois que certaines versions ont eu des problèmes mais que maintenant cela fonctionne.
- Pour des variables quantitatives ayant des unités différentes, il est préférable de faire une ACP réduite (les variables sont normées). Dans ce cas, les différences entre individus peuvent être comparées d'une variable à l'autre. Le découpage en classes peut-être intéressant si vous suspectez des liaisons non linéaires mais sinon il est préférable de standardiser.
- Il est difficile de comparer les résultats de plusieurs ACM car les dimensions ne sont pas les mêmes. Une méthode est plus adaptée, il s'agit de l'analyse factorielle multiple  (fonction MFA dans FactoMineR). Cette méthode va chercher des dimensions communes à toutes les années, et cela permettra de comparer plus facilement les résultats des différentes ACM. Il est ensuite possible de construire des classes après l'AFM.
- Je ne connais pas les tests économétriques
FH

Elena Stolyarova

unread,
Jul 10, 2012, 5:14:54 AM7/10/12
to factomin...@googlegroups.com
Pour le problème d'HCPC et découpage en classe, voilà le message erreur:

library(FactoMineR)
> vari <- base_quanti[,1]
> res.hcpc <- HCPC(vari, min=4, max=10, iter.max=10)
Erreur dans 1:nrow(auxF) : l'argument est de longueur nulle
De plus : Messages d'avis :
1: mean(<data.frame>) is deprecated.
 Use colMeans() or sapply(*, mean) instead. 
2: mean(<data.frame>) is deprecated.
 Use colMeans() or sapply(*, mean) instead. 
3: mean(<data.frame>) is deprecated.
 Use colMeans() or sapply(*, mean) instead. 
4: mean(<data.frame>) is deprecated.
 Use colMeans() or sapply(*, mean) instead. 
5: mean(<data.frame>) is deprecated.
 Use colMeans() or sapply(*, mean) instead. 


Le mardi 10 juillet 2012 10:54:13 UTC+2, Elena Stolyarova a écrit :

Elena Stolyarova

unread,
Jul 10, 2012, 6:37:42 AM7/10/12
to factomin...@googlegroups.com
Merci pour vos réponses, je vais suivre vos conseils.

Quant à nouvelle version - j'ai essayé hier la toute dernière, mais HCPC marche une fois sur deux. Sur la version  R 2.14.1 - HCPC marche, par contre le découpage ne marche pas. R indique l'erreur: Erreur dans 1:nrow(auxF) : l'argument est de longueur nulle

J'ai une question supplémentaire:
- par rapport aux liaisons non linéaires - comment le savoir? J'ai des soupçons que pour certains variables ce n'est pas le cas. Est-ce que l'utilisation de la fonction "pairs" est appropriée? Quand je l'applique pour voir visuellement  la matrice de corrélation, selon les variables elles sont: dispersées de façon aléatoire, le nuage des points forme un triangle, les points sont alignés à la fois sur les axes des abscisses et des ordonnés, pour certains il y a une relation linéaire.

Merci pour tout.

Claude Vogel

unread,
Jul 10, 2012, 8:13:35 AM7/10/12
to factomin...@googlegroups.com
Je confirme que HCPC, grace aux derniers updates de Francois, marche parfaitement. Il faut utiliser les toutes dernieres versions de R et FactomineR.

Claude

Elena Stolyarova

unread,
Jul 10, 2012, 9:06:07 AM7/10/12
to factomin...@googlegroups.com
Bonjour,

Monsieur Husson, j'ai reçu votre mail avec la nouvelle version de FactoMineR. Le tout marche sauf la découpage en classe. En fait quand j'écris en prenant votre exemple (la variable "the" contient bien les données...):

vari <- the[,22]
res.hcpc <- HCPC(vari, iter.max=10)
L'HCPC est effectué, mais les résultats ne sont pas stockés dans res.hcpc. R affiche ce message d'erreur:

Erreur dans 1:nrow(auxF) : l'argument est de longueur nulle

J'ai la toute dernière version de R.

Merci pour le nouvelle version. Je vais m'en renseigner sur l'AFM.

François Husson

unread,
Jul 10, 2012, 9:55:17 AM7/10/12
to factomin...@googlegroups.com
OK, I have fixed the problem (the problem was in the catdes function used to characterize the clusters).
I join a new version of FactoMineR (the zip file for Windows).

FH
FactoMineR_1.19.zip
Reply all
Reply to author
Forward
0 new messages