Tr.: Homogeneite des variances

11 views
Skip to first unread message

Irenikatche Akponikpe

unread,
Jun 13, 2006, 10:27:18 AM6/13/06
to biostat...@googlegroups.com
--- Dans ecofor...@yahoogroupes.fr, Moumouni Moussa Ismail
<mmismailfr@y...> a écrit :

Salut les amis,
D'abord je me rejouis de la nouvelle de la publication du document de
Romain et brule d'envie d'en decouvrir le contenu. Je crois par
ailleurs qu'un tel forum peut contribuer à sa promotion. Je pense
qu'il ne faut pas s'attaquer aux livres et à leurs auteurs. Chaque
auteur ecrit pour un public et il revient à tout un chacun de faire
l'effort de s'orienter vers les documents adressés au public auquel
il appartient. De plus en statistique, me semble t'il, il y a trop du
cas par cas. Les outils sont tellement contextués qu'à la base de
l'éducation, on ne saurait s'apesentir sur les utilisations vraiment
concretes. Ceci n'est cependant pas une excuse pour ce qui sont
qualifié de "boureaux", même si le concept ne me plait pas. Ces gars
n'ont vraiment pas fait leur job.

Au sujet de l'homogeneité des variances. Je pense que si un test
prealable est vraiment necessaire avant d'utiliser un outil (comme
ANOVA par exemple), un bon logiciel doit pouvoir generer les
statistics le concernant. C'est le cas de ANOVA avec SPSS. Dans la
rubrique option, on peut demander le test d'homogeneite de variance.
Et c'est justement le test de Levene que Romain a suggéré qui est
generé. La realisation du test d'homogeneité de variances n'est donc
pas un probleme majeur. La question est de savoir qu'il est utile de
l'effectuer. Je dis utile et non indispensable parce qu'on peut
parfois fermer les yeux sur certaines exigences ou assumptions des
tests. Par exemple David Garson
http://www2.chass.ncsu.edu/garson/pa765/statnote.htm dit que la
violation de ce test n'est pas fatal à ANOVA du fait de sa puissance.
Je recommande ce site à tout un chacun. Garson m'a paru tres tres
pratique et tres concret, aussi bien sur les utilités des, les
conditions d'utilisation, les concepts,
les statistiques generees et leur signification de meme que les
procedures SPSS et l'interpretation des resultats. De plus il
presente un certain nombre d'outils utilisés en sciences sociales.
Guten Appetit !

tschüs

Orou Gaoué <ogaoue@y...> wrote:

salut,
je suis d'acord avec le principe de "garbage in, .. garbage out"
soutenu par enock et soulemane.
je pense que ca doit nous amener a faire attention a ce qu'on demande
a notre logiciel de faire
quand nous analysons les donnees. cependant, la realite persiste que
nos livres statistiques ne
sont pas adapte pour enseigner efficacement les statistiques au genre
de scientifiques que nous
sommes, ... beaucoup plus ecologistes ou autres que mathematiciens.
Lorsque tu fais un tour des
papiers publie dans le monde francophone en particulier (en afrique
en general), l'utilisation
que l'on fait des statistiques est tout a fait modeste. Ceci dit, on
devrait savoir comment
enseigner les statistiques a pareil groupe; ... meme si la difference
n'est pas auissi grande
avec le monde scientifique europeen et consors. Je prend par exemple
les deux tableaux de la page
18 et 19 propose par Legendre et Brocard dans leur manuscript. Il
s'agit la d'elements tres
pratiques dont on a besoin. Mais lorsque tu parcours la plupart des
livres statistiques (pour ce
que je sais, dagnelie, zar, sokal et rholf, manly), tu ne verras pas
une seule page qui developpe
les choses pareillement. C'est en ca je dit que ces livres aux
programmes ont peche!

Je pense que nous devons aller au dela du test d'homogeneite des
variances et examiner le cas ou
on a une heterogeinte des variances. Que faire? Comme le suggere la
methode, il faut homogeneiser
les variances alors avant de continuer avec les analyses. Mais
comment homogeneiser? en attendant
que vous vous prononciez la dessus, je propose que l'on veille a
l'egalite de la taille des
groupes etudies afin d'avoir un dispositif equilibre, et en l'examen
des donnees afin d'ecarter
les valeurs abberantes. C'est a ce niveau que les suggestions de
Hermane viendront a point.

A la faveur d'un echange d'email avec Romain Glele (qui est
actuellement tres pris et ne peux
intervenir sur le forum), il suggerait que le test de Levene est
beaucoup plus approprie pour
tester l'homogeneite des variances. ceci en comparaison au test de
bartlett que suggere Legendre
et Brocard. Lorsqu'il sera disponible, on pourra revenir sur le debat.
aloha,

orou gaoue

--- Gbènato ACHIGAN wrote:

> Chers amis,
> "Garbage in garbage out". C'est le principe du travail a
l'ordinateur. Et on dit chez nous "qui
> sème l'arachide ne recolte pas du mais." Autrement dit si nous
introduisons des valeurs
> aberrantes dans la machine, quelle que soit la force du locigiel
statistique utilisé on
> recoltera des resultats qui seront peut etre jolis mais ne
reflectera rien de la realité. La
> statistique est une science vivante, mieux on sait manipuler le
pourquoi le quand et le comment
> des outils statistiques, mieux on explique les phenomenes. La
determination des valeurs
> aberrantes est une realité que nous ne devons pas occulter. Et un
moyen simple a cet effet est
> effectivement la courbe de distribution des frequences qui presente
toute suite la nature de la
> fonction de densité. L'utilisation aveugle des outils statistiques
(et je paraphrase Nourou, et
> j'espere que je ne me trompe pas) doit etre bannie de notre
procedure de traitement des
> données.
> Si la crainte des chiffres et des formules et un phenomene general,
la craintes des aberrations
> doit etre la peur quotidienne du chercheur. Et la dessus nous
devons etre tous engagés. Pas
> pour ravir ni a Romain ni a Come leur "gagne pain", mais pour les
aider à mieux faire.
> Je ne suis pas totalement d'avis avec Orou que de par le monde les
livres statitisques n'ont
> aligné que formule et chiffres. Si avec Dagnelie nous avons eu une
mauvaise experience ce
> n'etait certainement pas de la faute de cet eminent auteur
francophone mais plutot du
> "bourreau" qui etait appelé a nous enseigner la statistique en
utilsant l'approche Dagnelie. Et
> nous avions aussi contribuer a cet affaiblissement des capacités.
Nous avions eu notre part de
> responsabilité. Nous avons appris a nous contenter du peu dans la
mesure ou cela ne ruinait pas
> notre moyenne pour passer en classe superieure. Aujourd'hui, en
face de la realité scientifique
> nous devons nous remettre en cause et regarder devant. Et la je
rejoins sa conclusion. Test
> d'homogeneité, moyenne mobiles, moyennes geometriques, ou autres
analyses, je repasse ici je
> merveilleux site (un livre electronique) que Orou a partagé il y a
plus d'un an et que
> certainement nous avons oublié. Je l'utilise toujours et c'est un
tresor a
> conserver dans ces favoris.
http://www.statsoftinc.com/textbook/stathome.html
>
> D'ici la portez vous bien.
> Tschuss.
>
> Nourou Soulemane YOROU wrote:
>
> Salut les gars,
> On assiste depuis peu à un débat aussi interessent sur
> les analyses statiatiques. Je remercie les uns et les
> autres pour ces échanges d´informations combien
> fructueuses.
> La question d´identification des valeurs aberrantes
> soulevée par AVOHOU me parait bien pertinente et une
> grande attention devrait être accordée à cette étape
> avant de poursuivre avec les analyses. Je pense qu´il
> y a un certain nombre de logiciel qui procède à cette
> étape. Je sais qu´avec STAST-ITCF par exemple, après
> l´entrée des données et avant qu´il ne démarre
> l´analyse, le logiciel passe au laser les données
> entrées et il met en évidence les valeurs qu´il juge
> "suspectes" (qui sont trop élèvées ou trop basses par
> rapport à la tendance générale et il demande s´il faut
> tenir compte de ces valeurs dans l´analyse ou si
> l´utilisateur désire les éliminer/corrigér du fait
> d´éventuelles erreurs. Je pense que les concepteurs
> des différents programmes sont conscients de cela et
> que la plupart des logiciels sont dotés de cette
> étape. Le mieux c´est de lire munitieusement, pour
> chaque logiciel qu´on désire utiliser, les conditions
> et les différentes possibilités du logiciel afin
> de comprendre ce que le logiciel peut faire et les
> limites de son utilisation. La plupart du temps, nous
> avons nos données, on a entendu dire que tel logiciel
> fait telle analyse, alors on foue nos données et paf,
> on clique ANOVA, Cluster, corrélation ou je ne sais
> quelle analyse et on obtient les résultats qu´on
> interprète sans vérifier les critères et conditions
> dont tient compte le logiciel dans les anaylses.
> Lisons donc les conditions d´utilisation du logiciel
> avavnt son utilisation.
> Merci
> Nourou
>
>
>
>
>
> --- Orou Gaoué a écrit :
> >
> > aloha, et encore une fois bienvenue aux new members
> > je pense que le probleme veritable qui se pose par
> > rapport a l'utilisation convenable des test
> > statistiques est d'ordre general et ne concerne pas
> > singulierement les pays francophones. je
> > dois quand meme reconnaitre que la faculte des
> > sciences agronomiques (FSA) a particulierement
> > peche dans la formation de ses produits sur le plan
> > statistique et ceci est la faute de quelques
> > hommes en qui on a mal fait d'avoir eu confiance. je
> > ne me prive aucunement de le dire et de dire
> > que nous devons maintenant regarder devant et
> > oublier ce mal qu'ils nous ont fait, nos boureaux!
> >
> > J'ai eu la chance de lire un ou deux articles qui
> > critiquent l'utilisation des test statistiques
> > par les scientifiques meme les plus emerites. Le
> > bilan n'est pas reluisant et beaucoup de
> > plublications (au niveau international) ont des
> > insuffisances chroniques en matiere de dispositif
> > experimental, la pseudorepetition particulierement
> > et les conditions prealables a l'utilisation
> > de tel ou tel test. Je pense pour ma part (et je
> > pense avoir dit ceci deja sur ce forum) que la
> > faute est d'une part aux livrex de statistique au
> > programme et d'autre part, a rigidite
> > pedagogique des profs de statistique en general.
> >
> > La plupart des livre statistiques (dagnelie, zar,
> > sokal & rholf, etc) sont fait de formules a
> > pres de 80%. Ces livres au programme ne font que
> > exposer les differents tests et les methodes de
> > calcul. Ils ne present pas souvent pas le contexte
> > generale de l'application des tests, la
> > procedure pour le choix des tests, les erreurs a
> > eviter, etc. Des livres aussi rigides comme ceux
> > qu'on connait, ne permettront pas a l'utilisateur de
> > trouver tout de suite ceux dont il a besoin
> > lorsqu'il le consulte. Il est plutot decourage par
> > les multiples formules incomprehensibles que
> > le livre expose avec euphorie (triste!). J'espere
> > que le livre de Romain Glele vient comme pour
> > corriger ceci. Je n'ai pas eu la chance de le lire
> > mais je vous annonce que notre collegue
> > biometricien a sortit un titre recemment sur les
> > statistiques faciles. Le livre est en vente sur
> > le campus de l'Universite d'Abomey Calavi (Benin).
> > lisez le et appreciez!
> >
> > La grande majorite des profs de statistiques n'ont
> > jamais su comment enseigner differemment les
> > statistiques. Ils se contentent de suivre tout cru
> > le plan des livre au programme et font donc
> > les meme erreurs que les concepteurs des programmes
> > statistiques. Les statisticiens se sont cru
> > comme des mathematiciens pure et dure et prennent du
> > plaisir a detailler des formules.
> > Malheureusement, la statistique ne doit pas paraitre
> > comme une matiere fondamentale et theorique
> > mais comme un OUTIL pour le scientifique. Alors il
> > faut d'abord passer l'utile a l'utilisateur
> > (la procedure de choix des tests, les conditions des
> > tests et comment les verifier, et
> > l'utilisation des programmes ou logiciels de
> > statistiques). A un autre niveau superieur, on
> > pourra servir les fondements mathematiques des
> > differents tests afin que l'apprenant ou
> > l'utilisateur puisse l'utiliser pour mieux
> > interpreter ou critiquer les resultats obtenus. S'il
> > m'etait donne de concevoir un programme de biometrie
> > au niveau BSc et PhD, c'est ce que je
> > proposerais. J'espere vivement que les biometriciens
> > du groupe concoivent les choses differemment
> > de leurs ainees, nos bourreaux!
> >
> > Par rapport aux donnees abberantes, c'est bien
> > pertinent. Je pense que pour la plupart,
> > l'identification de ces variables se fait par la
> > methode graphique. Je me souvient qu'on
> > utilisait les moyennes mobiles en hydrologie pour
> > verifier les donnees pluviometriques sur une
> > periode normale. Je pense aussi que la premiere
> > etape d'une analyse statistique consiste a passer
> > au peigne fin ses donnees, en faisant des 'cross
> > comparison" entre les donnees entrees dans le
> > tableur avec celles qu'on a dans son carnet de
> > terrain (de collecte de donnees). Malheureusement,
> > certains ne se donnent pas cette peine parce que la
> > verification est percue a tord comme inutile,
> > comptant resolument sur la force des test
> > statistiques pour accoucher les conclusions
> > parfaites.
> > Je pense que l'une des premieres choses a faire avec
> > ses donnees, c'est de faire les graphes
> > exploratrices (distribution de frequences, nuages de
> > points, etc). ces graphes permettent de
> > deceler les anomalies ou erreurs de frappes ou de
> > collectes. De facon globale, pour chaque
> > variable etudiee, il est conseille de faire tout au
> > moins la distribution de frequence (si
> > possible) puisque c'est la premiere etape pour se
> > faire une idee de la distribution (normale ou
> > non des donnees) des observations. L'analyse des
> > residus ou les test de nromalites et
> > d'homogeneite des variances, etc viendront ensuite
> > et le reste du choix des methodes
> > (parametriques ou non parametriques) viendra en
> > consequence.
> >
> > aloha,
> >
> > orou gaoue
> >
> >
> > --- Hermane AVOHOU wrote:
> >
> > > Merci chers membres d'Ecoforum2003 pour vos
> > différentes contributions.
> > > J'aimerais d'abord intervenir pour "expliquer" un
> > tant soit peu pourquoi beaucoup de chercheurs
> > > ignore délibérément la question de l'homogénéité
> > des variances et de la transformation des
> > > données.
> > > Certains auteurs en particulier francophones, par
> > exemple Dagnélie que nous connaissons tous et
> > > qui constitute pratiquement l'auteur de référence
> > en matière de Statistique appliquée à la FSA
> > > et les animateurs du Groupe Statsoft soutiennent
> > que l'ANOVA est assez rigide à la
> > > non-homogénéité des variances et à la distribution
> > non-normale des données au sein des groupes
> > > comparés. Ces auteurs ne mettent pas suffisament
> > en évidence les dangers d'une violation de
> > > l'une de ces deux hypothèses. Ceci explique un peu
> > pourquoi, chez nous au Bénin ou au sein de
> > > la communauté scientifique francophone beaucoup de
> > chercheurs ignorent délibérément ces deux
> > > conditions avant d'appliquer le test d'ANOVA.
> > > Un autre aspect sur lequel je voudrais revenir et
> > je pense aussi très important: Orou a cité 8
> > > étapes à suivre dans l'application du test
> > d'analyse de variance. Je pense bien que qu'il y a
> > > une étape capitale qu'il a omis ou à laquelle les
> > éminents auteurs dont il nous a parlé n'ont
> > > pas accordé l'importance que cela requiert. Cette
> > étape est la Détermination des valeurs
> > > aberrantes ou des valeurs atypiques. Je pense que
> > lorsqu'on a une série de données, la première
> > > étape est d'identifier les valeurs dites atypiques
> > au sein de chaque groupe et de pouvoir
> > > s'expliquer si ces valeurs sont dues à des erreurs
> > de mesure, de manipulation,
> > > d'échantillonnage (cas d'un arbre sur une
> > termitière), aux antécédents culturaux de la
> > parcelle
> > > d'expérimentation, etc. Ce qui se passe le plus
> > souvent est que ce sont ces valeurs atypiques
> > > qui font augmenter la variance au sein des groupes
> > et induisent des différences significatives
> > > de grandeurs entre les variances des différents
> > groupes comparés. Ces
> > > valeurs rendent même la stabilisation des
> > variances par les transformations de données
> > > difficiles. L'élimination de ces valeurs lorsque
> > cela est justifié, facilite bien la
> > > satisfaction de la "disposition légale" de
> > l'homogénéité des variances entre les groupes.
> > > Malheureusement, je ne connais pas de méthodes
> > standards et universelles pour procéder à une
> > > pareille élimination de données. Les seules que je
> > connaisse et que je partegerai vonlontiers
> > > avec vous sont le test de Grubbs et l'utilisation
> > à taton de la régression linéaire pour
> > > identifier les "intruses".
> > > Peut-être que Orou ou tout autre membre de
> > Ecoforum, en particulier les spécialistes en
> > > biométrie comme Côme et Romain peuvent investiguer
> > ce domaine et nous éclairer beaucoup plus.
> > > Hermane
> >
> > > Date : Sun, 13 Mar 2005 19:12:00 +0100 (CET)
> > > De : Mohamed Nasser BACO
> > > Objet : Re: Test d'homogeneite des variances
> > >
> > > Chers amis,
> > > Je profite de l'arsenal statistique dont Gaoué
> > nous abreuve pour dire un mot et rappeler aux
> > > uns et aux autres que je suis bien vivant. Avant
> > mon petit commentaire, je voudrais une fois
> > > encore remercier Gaoué qui n'hésite pas à partager
> > sa documentation avec nous.
> > > Les statistiques ont toujours été les bêtes noirs
> > de plus d'un. La faute n'est pas toujours
> > > imputable à notre faible coéfficient intellectuel
> > mais surtout à l'initiation de départ. Nombre
> > > d'entre- nous avons démarré les statistiques avec
> > des fondations bancales et la suite vous le
> > > savez, ce sont les monstruosités que vous lisez
> > dans les rapports. C'est vrai que
> > > l'autodictatie devrait permettre de relever la
> > pente, mais que peut-on dans un univers où la
> > > littérature en statistique ne se limite qu'à
> > Dagnélie. Il est vrai que les choses changent
> > > (avec le web par exemple) me direz-vous,
> > rappelez-vous cependant que ces changements ne sont
> > > que récents.
> > > De toutes les manières, à l'instar de Gaoué, nous
> > devons nous mettre à l'école des statistiques
> > > et vaincre notre cécité scientifique.
> > > Je voudrais profiter de ce message pour féliciter
> > Romain GLELE qui vient de sortir une brochure
> > > pratique sur les statistiques. J'espère que
> > désormais nos publications scientifiques verrons
> > > leur qualité améliorée.
> > > Je signale tout de même que notre objectif
> > prétendre à faire de nous des experts statisticiens.
> > > Chacun à son boulot dans la communauté
> > scientifique. Romain et Côme doivent craindre pour
> > leur
> > > poste dans un boulot où tout le monde se lancerait
> > dans la maîtrise des statistiques (rire). A
> > > chacun son marigot.
> > > Nasser.
> > > .
> > >
> > > Gbènato ACHIGAN wrote:
> > > Guten Tag Orou et autres membres,
> > > C'est toujours bien de s'enrichir des lectures de
> > Orou. Je commence donc par prendre acte de la
> > > reception des differents fichiers pour encourager
> > orou dans sa lecture. Autrement il risque de
> > > se sentir orphelin.
> > > Le probleme de la statistique appliquée aux
> > evenements de la vie est un probleme recurrent qui
> > > n'offre pas toujours une issue aisée aux
> > utilisateurs que nous sommes. De la statistique
> > > descritive à l'analyse multivariée il y a beaucoup
> > de fossés dans lesquels nous nous enlisons
> > > tres facilement. Mais le test d'homogeneité des
> > variances n'est plus un grand mystère pour
> > > beaucoup de neophytes comme moi. Et la plupart des
> > memoires sortir de la FSA ne violent plus
> > > ces dispositions "legales". Le probleme reside
> > peut etre et surtout dans "lequel des tests faut
> > > il utiliser et quelle interpretation cela
> > suggere?". L'interpretation des resultats qui
> > > decoulent de nos analyses peche souvent par le
> > faut que nous faisons un test parce que nous
> > > avons vu Jean ou Pierre ou tres souvent notre
> > superviseur de these faire le meme test. Et la
> > > dessus je partage les visions et commentaires de
> > orou (meme si souvent il est plus critique
> > > qu'il ne le faut). Cependant l'origine de notre
> > ignorance est à rechercher
> > > dans notre circuit éducatif. Et pour beaucoup de
> > personnes il est plus aisé de calculer une
> > > moyenne arithmetrique qu'une moyenne geometrique,
> > l'introduction d'une troisieme dimension
> > > amene plus de probleme aux scientifiques qu'elle
> > ne l'aide à resoudre son probleme. Le
> > > developpement du logiciel R
> > (http://cran.us.r-project.org/) n'est pas forcement
> > une voie de
> > > facilité. Beaucoup de chercheurs rechignent deja à
> > utiliser les nombreux programmes mis a leur
> > > disposition aussi gratuitement que le R. Mais
> > combien vraiment savent manipuler ces programmes?
> > > Combien savent deja faire de simples sommes avec
> > Excel? On prefere se referer aux services de
> > > Romain autres genies comme Côme. Et la situation
> > restera ainsi pour plusieurs annees encore
> > > chez moi au Benin et meme aux USA. Mais entre
> > temps je serai toujours heureux de partager tes
> > > lectures orou.
> > >
> > > Orou Gaoué wrote:
> > >
> > > Aloha membres de Ecoforum,
> > > Voici encore une autre source intarissable pour
> > ameliorer nos connaissances scientifiques: le
> > > LABO DU PROF LEGENDRE. Si vous n'aviez jamais
> > entendu parler du professeur canadien Pierre
> > > Legendre, sachez que ce canadien au cheveux clair
> > est une legende. Dans le domaine de la
> > > statistique au niveau internationale, quelques
> > noms pointent lorsqu'on parcours les articles
> > > scientifiques les plus cotes: Legendre, Sokal &
> > Rolf, Zar, Underwood, Manly. Legendre, un ami
> > > de
> > > Sokal et Rolf est implique dans le developpement
> > du prologiciel R que certain utilisent deja.
> > > Ce
> > > logiciel est disponible gratuitement sur le site
> > web du prof. (La) Legende a developper et
> > > expliquer terre a terre certaines monstruiosites
> > statistiques. De surcroit, il l'a fait aussi
> > > bien en francais qu'en anglais, payant du coup, de
> > sa boite cervicale, le peche de certains et
> > > la
> > > vie scientifique nous les francophones
> > non-anglophones. Ce qui fait la difference dans les

=== message truncated ===

Ismail M.
Moumouni
Rural Sociology
WISOLA / LGF / HUB
Luisenstr. 53, 10117 Berlin
Mobile: 00491628364821
Office: 004930 20936546

Home: 00493050012557
Fax: 00493020936542
Email: mmismailfr@y...



---------------------------------
Découvrez nos promotions exclusives "destination de la Tunisie, du
Maroc, des Baléares et la Rép. Dominicaine sur Yahoo! Voyages.

--- Fin du message transféré ---


Reply all
Reply to author
Forward
0 new messages