Aloha membres de Ecoforum,
Voici encore une autre source intarissable pour ameliorer nos
connaissances scientifiques: le
LABO DU PROF LEGENDRE. Si vous n'aviez jamais entendu parler du
professeur canadien Pierre
Legendre, sachez que ce canadien au cheveux clair est une legende.
Dans le domaine de la
statistique au niveau internationale, quelques noms pointent
lorsqu'on parcours les articles
scientifiques les plus cotes: Legendre, Sokal & Rolf, Zar, Underwood,
Manly. Legendre, un ami de
Sokal et Rolf est implique dans le developpement du prologiciel R que
certain utilisent deja. Ce
logiciel est disponible gratuitement sur le site web du prof. (La)
Legende a developper et
expliquer terre a terre certaines monstruiosites statistiques. De
surcroit, il l'a fait aussi
bien en francais qu'en anglais, payant du coup, de sa boite
cervicale, le peche de certains et la
vie scientifique nous les francophones non-anglophones. Ce qui fait
la difference dans les textes
de Legendre et les membres de son prestigieux labo base a
l'Universite de Montreal au Quebec,
c'est qu'ils expliquent souvent le "pourquoi" et le "quand" des tests
statistiques avant de se
lancer dans le "comment" et le "quoi". Ceci est tres rare mais utile
pour les scientifiques qui
pour la plupart sont mathematiquement analphabetes (j'exagere un
peu,.... mais on est pas loin de
la). L'un des collaborateurs de Legendre, ancien post doc dans son
labo et maintenant son adjoint
direct, Dr Borcard Daniel developpe un cours sur les notions
essentielles de biometrie, version
francaise. Je passe ici le site web de ce cours qu'il donne a
l'Universite de Montreal. Il y a
des documents a telecharger et ne vous faites pas prier.
http://biol10.biol.umontreal.ca/BIO2042/
J'ai aussi attache a ce message, un manuscript inedit, soumis par
Legendre & Borcard au Journal
of Statistical Computation and Simulation, sur les test de
d'homogeneite des variances. Pour vous
rafraichir la memoire, avant de faire une analyse de variance, il
faut veuiller a la normalite
des donnees collectees pour chaque variables testees, a
l'independance des populations ou groupes
etudiees (la on fait souvent trop d'erreur dans le choix de nos
groupes: par exemple prendre deux
placeaux espaces de quelques metres comme des populations --- c'est
la PSEUDOREPLICATION),
l'HOMOGENEITE DES VARIANCES entre les groupes. Cette derniere
condition est testee par le test de
Bartllet, le test M de Box, le Test C de Cochran. Cependant,
lorsqu'on a un logiciel, on ne se
demande pas lequel de ces tests est approprie; on s'y lance et on
calcule l'une d'entre elles et
on continue l'analyse. Dans le pire des cas, on viole caremment cette
disposition "legale" et on
fait notre ANOVA. Malheureusement pour cette categorie de
scientifiques, Legendre, Sokal & Rolf,
Zar tous sont unanimes sur le fait que l'ANOVA est tres sensible a
l'heterogeinite des variances
meme lorsque les donnees sont normalement distribuees pour la
variable etudiee. Dans cet article,
les auteurs justifient l'importance du test d'homogeneite des
variances et arrivent a la
conclusion que le test de Bartllet et le test M de Box sont les
meilleurs et les plus
recommendes. Ce qui rend cet article un document decisif, c'est qu'a
la page 18 et 19, les
auteurs presentent deux tableaux pour guider dans la realisation du
test d'homogeneite des
variance et l'analyse des variance et le test t d'egalite des
moyennes (student). Ces tableaux
indiquent a l'utilisateur les etapes a suivre (8 etapes en tout pour
chaque cas) avant de faire
l'analyse de variance (Verifier la normalite - faire le test
d'homogeneite des variance,
homgeneiser les variances si elles ne sont pas homogenes, normaliser
les donnees par les
transformations si elles ne le sont pas -choisir selon que la taille
des echantillons sont egales
ou non le test approprie ou les modifications appropriees, etc). je
vous invite a lire l'article.
J'ai aussi attache un autre article tres important sur la
PSEUDOREPLICATION (malheureusement le
message a ete renvoye. -- je l'envoie dans un second message).
j'avais envoye un autre de ce
genre il y a quelques mois. je vous invite a le lire et a prendre
acte tout au moins. Je continue
avec mes recherches sur les transformation des donnees. La question
qui m'est venue a
la tete, c'est quand transformer les donnees et quelle transformation
(log, racine caree, arcsin,
etc) utiliser pour quelle genre de donnees ou pour quelle genre de
distribution des donnees (pour
une variable donnee). Ceci est tres important parce que la
transformation des donnees est une
porte de sortie lorsque la distribution de nos donnees n'est pas
normale (pour la normalisation).
a suivre...
Orou G. Gaoué
http://orougaoue.populus.ch
--- Fin du message transf€ ¦ér€ ¦é ---