Tr.: Re:Homogeneite des variances

5 views
Skip to first unread message

Irenikatche Akponikpe

unread,
Jun 13, 2006, 10:20:35 AM6/13/06
to biostat...@googlegroups.com
--- Dans ecofor...@yahoogroupes.fr, Orou "Gaou€  é" <ogaoue@y...>
a € ¦écrit€ ¦ :

aloha, et encore une fois bienvenue aux new members
je pense que le probleme veritable qui se pose par rapport a
l'utilisation convenable des test
statistiques est d'ordre general et ne concerne pas singulierement
les pays francophones. je
dois quand meme reconnaitre que la faculte des sciences agronomiques
(FSA) a particulierement
peche dans la formation de ses produits sur le plan statistique et
ceci est la faute de quelques
hommes en qui on a mal fait d'avoir eu confiance. je ne me prive
aucunement de le dire et de dire
que nous devons maintenant regarder devant et oublier ce mal qu'ils
nous ont fait, nos boureaux!

J'ai eu la chance de lire un ou deux articles qui critiquent
l'utilisation des test statistiques
par les scientifiques meme les plus emerites. Le bilan n'est pas
reluisant et beaucoup de
plublications (au niveau international) ont des insuffisances
chroniques en matiere de dispositif
experimental, la pseudorepetition particulierement et les conditions
prealables a l'utilisation
de tel ou tel test. Je pense pour ma part (et je pense avoir dit ceci
deja sur ce forum) que la
faute est d'une part aux livrex de statistique au programme et
d'autre part, a rigidite
pedagogique des profs de statistique en general.

La plupart des livre statistiques (dagnelie, zar, sokal & rholf, etc)
sont fait de formules a
pres de 80%. Ces livres au programme ne font que exposer les
differents tests et les methodes de
calcul. Ils ne present pas souvent pas le contexte generale de
l'application des tests, la
procedure pour le choix des tests, les erreurs a eviter, etc. Des
livres aussi rigides comme ceux
qu'on connait, ne permettront pas a l'utilisateur de trouver tout de
suite ceux dont il a besoin
lorsqu'il le consulte. Il est plutot decourage par les multiples
formules incomprehensibles que
le livre expose avec euphorie (triste!). J'espere que le livre de
Romain Glele vient comme pour
corriger ceci. Je n'ai pas eu la chance de le lire mais je vous
annonce que notre collegue
biometricien a sortit un titre recemment sur les statistiques
faciles. Le livre est en vente sur
le campus de l'Universite d'Abomey Calavi (Benin). lisez le et
appreciez!

La grande majorite des profs de statistiques n'ont jamais su comment
enseigner differemment les
statistiques. Ils se contentent de suivre tout cru le plan des livre
au programme et font donc
les meme erreurs que les concepteurs des programmes statistiques. Les
statisticiens se sont cru
comme des mathematiciens pure et dure et prennent du plaisir a
detailler des formules.
Malheureusement, la statistique ne doit pas paraitre comme une
matiere fondamentale et theorique
mais comme un OUTIL pour le scientifique. Alors il faut d'abord
passer l'utile a l'utilisateur
(la procedure de choix des tests, les conditions des tests et comment
les verifier, et
l'utilisation des programmes ou logiciels de statistiques). A un
autre niveau superieur, on
pourra servir les fondements mathematiques des differents tests afin
que l'apprenant ou
l'utilisateur puisse l'utiliser pour mieux interpreter ou critiquer
les resultats obtenus. S'il
m'etait donne de concevoir un programme de biometrie au niveau BSc et
PhD, c'est ce que je
proposerais. J'espere vivement que les biometriciens du groupe
concoivent les choses differemment
de leurs ainees, nos bourreaux!

Par rapport aux donnees abberantes, c'est bien pertinent. Je pense
que pour la plupart,
l'identification de ces variables se fait par la methode graphique.
Je me souvient qu'on
utilisait les moyennes mobiles en hydrologie pour verifier les
donnees pluviometriques sur une
periode normale. Je pense aussi que la premiere etape d'une analyse
statistique consiste a passer
au peigne fin ses donnees, en faisant des 'cross comparison" entre
les donnees entrees dans le
tableur avec celles qu'on a dans son carnet de terrain (de collecte
de donnees). Malheureusement,
certains ne se donnent pas cette peine parce que la verification est
percue a tord comme inutile,
comptant resolument sur la force des test statistiques pour accoucher
les conclusions parfaites.
Je pense que l'une des premieres choses a faire avec ses donnees,
c'est de faire les graphes
exploratrices (distribution de frequences, nuages de points, etc).
ces graphes permettent de
deceler les anomalies ou erreurs de frappes ou de collectes. De facon
globale, pour chaque
variable etudiee, il est conseille de faire tout au moins la
distribution de frequence (si
possible) puisque c'est la premiere etape pour se faire une idee de
la distribution (normale ou
non des donnees) des observations. L'analyse des residus ou les test
de nromalites et
d'homogeneite des variances, etc viendront ensuite et le reste du
choix des methodes
(parametriques ou non parametriques) viendra en consequence.

aloha,

orou gaoue


--- Hermane AVOHOU <avoher@y...> wrote:

> Merci chers membres d'Ecoforum2003 pour vos différentes
contributions.
> J'aimerais d'abord intervenir pour "expliquer" un tant soit peu
pourquoi beaucoup de chercheurs
> ignore délibérément la question de l'homogénéité des variances et
de la transformation des
> données.
> Certains auteurs en particulier francophones, par exemple Dagnélie
que nous connaissons tous et
> qui constitute pratiquement l'auteur de référence en matière de
Statistique appliquée à la FSA
> et les animateurs du Groupe Statsoft soutiennent que l'ANOVA est
assez rigide à la
> non-homogénéité des variances et à la distribution non-normale des
données au sein des groupes
> comparés. Ces auteurs ne mettent pas suffisament en évidence les
dangers d'une violation de
> l'une de ces deux hypothèses. Ceci explique un peu pourquoi, chez
nous au Bénin ou au sein de
> la communauté scientifique francophone beaucoup de chercheurs
ignorent délibérément ces deux
> conditions avant d'appliquer le test d'ANOVA.
> Un autre aspect sur lequel je voudrais revenir et je pense aussi
très important: Orou a cité 8
> étapes à suivre dans l'application du test d'analyse de variance.
Je pense bien que qu'il y a
> une étape capitale qu'il a omis ou à laquelle les éminents auteurs
dont il nous a parlé n'ont
> pas accordé l'importance que cela requiert. Cette étape est la
Détermination des valeurs
> aberrantes ou des valeurs atypiques. Je pense que lorsqu'on a une
série de données, la première
> étape est d'identifier les valeurs dites atypiques au sein de
chaque groupe et de pouvoir
> s'expliquer si ces valeurs sont dues à des erreurs de mesure, de
manipulation,
> d'échantillonnage (cas d'un arbre sur une termitière), aux
antécédents culturaux de la parcelle
> d'expérimentation, etc. Ce qui se passe le plus souvent est que ce
sont ces valeurs atypiques
> qui font augmenter la variance au sein des groupes et induisent des
différences significatives
> de grandeurs entre les variances des différents groupes comparés.
Ces
> valeurs rendent même la stabilisation des variances par les
transformations de données
> difficiles. L'élimination de ces valeurs lorsque cela est
justifié, facilite bien la
> satisfaction de la "disposition légale" de l'homogénéité des
variances entre les groupes.
> Malheureusement, je ne connais pas de méthodes standards et
universelles pour procéder à une
> pareille élimination de données. Les seules que je connaisse et que
je partegerai vonlontiers
> avec vous sont le test de Grubbs et l'utilisation à taton de la
régression linéaire pour
> identifier les "intruses".
> Peut-être que Orou ou tout autre membre de Ecoforum, en particulier
les spécialistes en
> biométrie comme Côme et Romain peuvent investiguer ce domaine et
nous éclairer beaucoup plus.
> Hermane

> Date : Sun, 13 Mar 2005 19:12:00 +0100 (CET)
> De : Mohamed Nasser BACO
> Objet : Re: Test d'homogeneite des variances
>
> Chers amis,
> Je profite de l'arsenal statistique dont Gaoué nous abreuve pour
dire un mot et rappeler aux
> uns et aux autres que je suis bien vivant. Avant mon petit
commentaire, je voudrais une fois
> encore remercier Gaoué qui n'hésite pas à partager sa documentation
avec nous.
> Les statistiques ont toujours été les bêtes noirs de plus d'un. La
faute n'est pas toujours
> imputable à notre faible coéfficient intellectuel mais surtout à
l'initiation de départ. Nombre
> d'entre- nous avons démarré les statistiques avec des fondations
bancales et la suite vous le
> savez, ce sont les monstruosités que vous lisez dans les rapports.
C'est vrai que
> l'autodictatie devrait permettre de relever la pente, mais que peut-
on dans un univers où la
> littérature en statistique ne se limite qu'à Dagnélie. Il est vrai
que les choses changent
> (avec le web par exemple) me direz-vous, rappelez-vous cependant
que ces changements ne sont
> que récents.
> De toutes les manières, à l'instar de Gaoué, nous devons nous
mettre à l'école des statistiques
> et vaincre notre cécité scientifique.
> Je voudrais profiter de ce message pour féliciter Romain GLELE qui
vient de sortir une brochure
> pratique sur les statistiques. J'espère que désormais nos
publications scientifiques verrons
> leur qualité améliorée.
> Je signale tout de même que notre objectif prétendre à faire de
nous des experts statisticiens.
> Chacun à son boulot dans la communauté scientifique. Romain et Côme
doivent craindre pour leur
> poste dans un boulot où tout le monde se lancerait dans la maîtrise
des statistiques (rire). A
> chacun son marigot.
> Nasser.
> .
>
> Gbènato ACHIGAN wrote:
> Guten Tag Orou et autres membres,
> C'est toujours bien de s'enrichir des lectures de Orou. Je commence
donc par prendre acte de la
> reception des differents fichiers pour encourager orou dans sa
lecture. Autrement il risque de
> se sentir orphelin.
> Le probleme de la statistique appliquée aux evenements de la vie
est un probleme recurrent qui
> n'offre pas toujours une issue aisée aux utilisateurs que nous
sommes. De la statistique
> descritive à l'analyse multivariée il y a beaucoup de fossés dans
lesquels nous nous enlisons
> tres facilement. Mais le test d'homogeneité des variances n'est
plus un grand mystère pour
> beaucoup de neophytes comme moi. Et la plupart des memoires sortir
de la FSA ne violent plus
> ces dispositions "legales". Le probleme reside peut etre et surtout
dans "lequel des tests faut
> il utiliser et quelle interpretation cela suggere?".
L'interpretation des resultats qui
> decoulent de nos analyses peche souvent par le faut que nous
faisons un test parce que nous
> avons vu Jean ou Pierre ou tres souvent notre superviseur de these
faire le meme test. Et la
> dessus je partage les visions et commentaires de orou (meme si
souvent il est plus critique
> qu'il ne le faut). Cependant l'origine de notre ignorance est à
rechercher
> dans notre circuit éducatif. Et pour beaucoup de personnes il est
plus aisé de calculer une
> moyenne arithmetrique qu'une moyenne geometrique, l'introduction
d'une troisieme dimension
> amene plus de probleme aux scientifiques qu'elle ne l'aide à
resoudre son probleme. Le
> developpement du logiciel R (http://cran.us.r-project.org/) n'est
pas forcement une voie de
> facilité. Beaucoup de chercheurs rechignent deja à utiliser les
nombreux programmes mis a leur
> disposition aussi gratuitement que le R. Mais combien vraiment
savent manipuler ces programmes?
> Combien savent deja faire de simples sommes avec Excel? On prefere
se referer aux services de
> Romain autres genies comme Côme. Et la situation restera ainsi pour
plusieurs annees encore
> chez moi au Benin et meme aux USA. Mais entre temps je serai
toujours heureux de partager tes
> lectures orou.
>
> Orou Gaoué wrote:
>
> Aloha membres de Ecoforum,
> Voici encore une autre source intarissable pour ameliorer nos
connaissances scientifiques: le
> LABO DU PROF LEGENDRE. Si vous n'aviez jamais entendu parler du
professeur canadien Pierre
> Legendre, sachez que ce canadien au cheveux clair est une legende.
Dans le domaine de la
> statistique au niveau internationale, quelques noms pointent
lorsqu'on parcours les articles
> scientifiques les plus cotes: Legendre, Sokal & Rolf, Zar,
Underwood, Manly. Legendre, un ami
> de
> Sokal et Rolf est implique dans le developpement du prologiciel R
que certain utilisent deja.
> Ce
> logiciel est disponible gratuitement sur le site web du prof. (La)
Legende a developper et
> expliquer terre a terre certaines monstruiosites statistiques. De
surcroit, il l'a fait aussi
> bien en francais qu'en anglais, payant du coup, de sa boite
cervicale, le peche de certains et
> la
> vie scientifique nous les francophones non-anglophones. Ce qui fait
la difference dans les
> textes
> de Legendre et les membres de son prestigieux labo base a
l'Universite de Montreal au Quebec,
> c'est qu'ils expliquent souvent le "pourquoi" et le "quand" des
tests statistiques avant de se
> lancer dans le "comment" et le "quoi". Ceci est tres rare mais
utile pour les scientifiques qui
> pour la plupart sont mathematiquement analphabetes (j'exagere un
peu,.... mais on est pas loin
> de
> la). L'un des collaborateurs de Legendre, ancien post doc dans son
labo et maintenant son
> adjoint
> direct, Dr Borcard Daniel developpe un cours sur les notions
essentielles de biometrie, version
> francaise. Je passe ici le site web de ce cours qu'il donne a
l'Universite de Montreal. Il y a
> des documents a telecharger et ne vous faites pas prier.
> http://biol10.biol.umontreal.ca/BIO2042/
>
> J'ai aussi attache a ce message, un manuscript inedit, soumis par
Legendre & Borcard au Journal
> of Statistical Computation and Simulation, sur les test de
d'homogeneite des variances. Pour
> vous
> rafraichir la memoire, avant de faire une analyse de variance, il
faut veuiller a la normalite
> des donnees collectees pour chaque variables testees, a
l'independance des populations ou
> groupes
> etudiees (la on fait souvent trop d'erreur dans le choix de nos
groupes: par exemple prendre
> deux
> placeaux espaces de quelques metres comme des populations --- c'est
la PSEUDOREPLICATION),
> l'HOMOGENEITE DES VARIANCES entre les groupes. Cette derniere
condition est testee par le test
> de
> Bartllet, le test M de Box, le Test C de Cochran. Cependant,
lorsqu'on a un logiciel, on ne se
> demande pas lequel de ces tests est approprie; on s'y lance et on
calcule l'une d'entre elles
> et
> on continue l'analyse. Dans le pire des cas, on viole caremment
cette disposition "legale" et
> on
> fait notre ANOVA. Malheureusement pour cette categorie de
scientifiques, Legendre, Sokal &
> Rolf,
> Zar tous sont unanimes sur le fait que l'ANOVA est tres sensible a
l'heterogeinite des
> variances
> meme lorsque les donnees sont normalement distribuees pour la
variable etudiee. Dans cet
> article,
> les auteurs justifient l'importance du test d'homogeneite des
variances et arrivent a la
> conclusion que le test de Bartllet et le test M de Box sont les
meilleurs et les plus
> recommendes. Ce qui rend cet article un document decisif, c'est
qu'a la page 18 et 19, les
> auteurs presentent deux tableaux pour guider dans la realisation du
test d'homogeneite des
> variance et l'analyse des variance et le test t d'egalite des
moyennes (student). Ces tableaux
> indiquent a l'utilisateur les etapes a suivre (8 etapes en tout
pour chaque cas) avant de faire
> l'analyse de variance (Verifier la normalite - faire le test
d'homogeneite des variance,
> homgeneiser les variances si elles ne sont pas homogenes,
normaliser les donnees par les
> transformations si elles ne le sont pas -choisir selon que la
taille des echantillons sont
> egales
> ou non le test approprie ou les modifications appropriees, etc). je
vous invite a lire
> l'article.
>
> J'ai aussi attache un autre article tres important sur la
PSEUDOREPLICATION (malheureusement le
> message a ete renvoye. -- je l'envoie dans un second message).
j'avais envoye un autre de ce
> genre il y a quelques mois. je vous invite a le lire et a prendre
acte tout au moins. Je
> continue
> avec mes recherches sur les transformation des donnees. La question
qui m'est venue a
> la tete, c'est quand transformer les donnees et quelle
transformation (log, racine caree,
> arcsin,
> etc) utiliser pour quelle genre de donnees ou pour quelle genre de
distribution des donnees
> (pour
> une variable donnee). Ceci est tres important parce que la
transformation des donnees est une
> porte de sortie lorsque la distribution de nos donnees n'est pas
normale (pour la
> normalisation).
> a suivre...
>
> Orou G. Gaoué
> http://orougaoue.populus.ch
>
>
> ---------- Let's build science together ... ----------
> Liens Yahoo! Groupes
>
>
>
>
>
>
> -------------------------------------------------------
> Enoch G. Achigan-Dako
> Johannes-R-Becher Straße 11/439
> 04279 Leipzig
> Deutschland
> Mobile: +49 (0) 17629843738
> Email: dachigan@y...
> http://myprofile.cos.com/dachigan
>
>
>
>
> ---------------------------------
> Découvrez le nouveau Yahoo! Mail : 250 Mo d'espace de stockage pour
vos mails !
> Créez votre Yahoo! Mail
>
>
> ---------- Let's build science together ... ----------
>
>
> Sponsor Yahoo! Groupes
>
> ---------------------------------
> Liens Yahoo! Groupes
>
> Pour consulter votre groupe en ligne, accédez à :
> http://fr.groups.yahoo.com/group/ecoforum2003/
>
> Pour vous désincrire de ce groupe, envoyez un mail à :
> ecoforum2003-...@yahoogroupes.fr
>
> L'utilisation de Yahoo! Groupes est soumise à l'acceptation des
conditions d'utilisation.
>
>
>
> ---------------------------------
> Découvrez le nouveau Yahoo! Mail : 250 Mo d'espace de stockage pour
vos mails !
> Créez votre Yahoo! Mail
>
> [Ce message contenait initialement des pièces jointes]
>
>
>
>
______________________________________________________________________
__
>
______________________________________________________________________
__
>
> Message : 2
> Date : Sun, 13 Mar 2005 22:15:32 -0000
> De : "ogaoue"
> Objet : about ecoforum
>
>
> Hi
> Ecoforum is growing with 41 members up to now. We unfortunately
suspended some
> members because they were not reacting to any message and even to
personal ones. We
> freely assumed that they were no longer interested in the forum and
took the right
> decision at the right time.
>
> I want to update new members a little bit about the way the group
works. This is the third
> year of Ecoforum and we are preparing for a kind of report to show
what we have achieved
> together and suggest where to go from now. A debate will be
intitiated shortly about this
> last part.
>
> (1)We use both FRENCH and ENGLISH as working language.
>
> (2)You may access to the list of members directly on the website of
> ecoforum.
>
> (3)Everybody is free to post any message related to ecology ans
asscociated sciences, ask
> questions, comment on documents, share information, suggest some
hints,etc. The group
> is pretty dynamic and the members of the group are the one giving
life to it.
>
> (4)You're expected to contribute fully to ecoforum, without
hesitation. To
> start with it, the group is expecting you to introduce your self
> by telling us what are you doing, where you are, the degree you
> received, and the one you pursue, your domain of interest, any paper
> you have published,and others. Please feel free to do it the way it
> suits you the best.
>
> Let me (ogaoue@y...) or Honore Biaou (hbiaou@y...) know if you have
any
> problem or if you want to know more.
>
> orou gaoue
>
>
>
>
>
>
______________________________________________________________________
__
>
______________________________________________________________________
__
>
>
>
> ---------- Let's build science together ... ----------
> --------------------------------------------------------------------
----
> Liens Yahoo! Groupes
>
>
>
>
> --------------------------------------------------------------------
----
>
>
>
>
>
>
> Hermane AVOHOU
> Ingénieur Agronome
> 04 BP 0419, Cotonou
> Cel: (229)061169
> h.avohou@c...
> avoher@y...
>
>
> ---------------------------------
> Découvrez nos promotions exclusives "destination de la Tunisie, du
Maroc, des Baléares et la
> Rép. Dominicaine sur Yahoo! Voyages.

--- Fin du message transf€ ¦ér€ ¦é ---

Reply all
Reply to author
Forward
0 new messages