Tr.: Re: EcoNews Transformation normalisatrice

13 views

Skip to first unread message

Irenikatche Akponikpe

unread,

Jun 13, 2006, 10:40:55 AM6/13/06

to biostat...@googlegroups.com

--- Dans ecofor...@yahoogroupes.fr, Orou "Gaou€ é" <ogaoue@y...>
a € ¦écrit€ ¦ :

Aloha,
Je pense que Silvere a initie un debat tres interessant sur lequel
j'invite tout le monde a
intervenir. J'y reviendrai!
Les commentaires de Hermane sur les transformations des variables
viennent poser quelques
problemes serieux. Je fais allusion singulierement a la deuxieme
partie de ses preoccupations. Je
donnerai mes commentaires par rapport a cela en derniere position.
Mais bien avant, penchons nous
un peu sur la determination du type de transformation appropriee.

1. J'ai retrouve la methode proposee par Hermane (faisant allusion au
grand Dagnelie 1986, clin
d'eoil a Romain) dans Scheiner & Gurevitch (2001, p165: Design and
analysis of ecological
experiments. Oxford Univ Press, 2d edition). Il s'agit de
l'utilisation de la pente de la
regression entre le logarithme des moyennes et le log de variances.
Mais a ce niveau, il y a deux
problemes qui se posent:

1.1. Point 3 du message de Hermane: Il s'agit de la regression des
log de QUELLES varianceS et de
quelles moyenneS? Rappelez vous que pour la variable a transformer,
on a plusieurs groupes ou
populations a comparer. Il s'agira de cacluler la moyenne et la
variance de chaque population
pour la meme variable et apres faire la regression des logs.

1.2. On a besoin d'avoir un tableau des valeurs de la pente b de la
regression afin de determiner
a chaque fois le type de transformation necessaire. Je n'ai pas
encore rencontre ce genre de
tableau dans les livres statistiques que j'ai fouille. Dans Scheiner
et Gurevich ou la methode a
ete decrite, voici les deux valeures qu'ils donnent:

**** si la pente b=1.0 alors if faut une tranformation log
**** si la pente b = 1.5 alors il faut une transformation
inverse de la racine carree.

Du coup, ceci laisse plusieurs vides a combler. Et de fait, cela me
ramene a l'utilite de cette
methode. Meme si avec les logiciels, il est facile de calculer les
parametres et de faire toute
sorte de tranformations possibles (!!!), on est pris de court. En
optant pour les methodes
graphiques dans le cas de la determination des types de
transformation appropriees, j'evitais de
tomber dans le piege statistique que j'ai toujours denonce: s'enfouir
dans les meandres des
computations et laisser la substance sur le bas cote. En fait, en
fonction de la forme de la
distribution de frequence, on peut dire le type de distribution
(poissonienne, contagieuse ou
uniforme) auquel on a faire. Il s'agit de considerer le cote ou on a
l'excentration de la courbe
(si la mode et la plupart des observation sont concentree a gauche ou
a droite) et de voir aussi
s'il y a applatissement ou pas. J'ai indique brievement dans mon
precedent message, a quelle
distribution correspond chaque cas de figure.

La ou l'intervention de Hermane apporte encore un plus, c'est
l'utilisation des relations entre
variance et moyenne pour determiner le type de distribution. Il
s'agit d'une version mathematique
qui appuie la methode graphique. Cependant, je voudrais revenir sur
les relations entre variance
et moyenne dans le cas d'une distribution poissonienne. J'ai encore
verifie dans mes references
et je retrouve que pour une distribution poissonienne, VARIANCE =
MOYENNE (Zar 1999 p:573,
Borcard 2005 p:4). En fait, la relation entre la variance et la
moyenne dans ce cas est bien
proportionel mais avec un intercept k = 1 (voir point 1 du message de
Hermane). Voici en clair
les relations entre variance et moyenne et les distribution associees:

*** Variance = moyenne : Distribution POISSONNIENNE (k=1)
*** Variance > moyenne : Distribution CONTAGIEUSE (k>1)
*** Variance < moyenne : Distribution UNIFORME (k<1)

Eh damn! je ne souhaitais pas que le forum ici se transforme en des
demonstrations qui perdent le
reste dans le debat. Je souhaitais que l'essentiel soit dit afin que
l'essentiel soit retenu.
Malheureusement je me suis retrouve hors du cadre. Mais pour y
revenir, je voudrais discuter le
dernier point de Hermane sur que choisir des valeures transformees et
orginale.

2. En generale dans la litterature, les conclusions sont tirees sur
les valeurs obtenue des
transformation inverses et non des valeurs tranformee. Si on a fait
par exemple une
transformation log, on retransforme les parametres de centralites par
l'inverse log et on eleve
au carree lorsqu'on a utilise la racine carree a la transformation.
Mais malheusement Zar
(1999:277) et Scheiner & Gurevich (2001: 59) soutiennent que les
valeurs obtenues sont pour la
plupart biaisees. Cependant, le biais dans le cas de la moyenne est
raisonnablement faible
lorsque les valeurs transformees obtenues sont elevees (dans le cas
ds tranformations log). Il y
a ici un grand besoin de documenter le debat et d'obtenir davantage
de garantie. Et en plus, il
faut rappeler, que toutes les donnees ne sont pas necessairement
tranformable (convenablement) et
que les tranformations ont aussi des inconvenients. J'espere que
Come et Romain et autres liront
ces dernieres phrases.

orou gaoue

--- Hermane AVOHOU <avoher@y...> wrote:
> Chers Collègues,
> J'espère que c'est la pleine forme chez tous le monde. Il y a eu un
long silence depuis les
> derniers messages de Gaoué et de Sylvère. Je pense que tout le
monde doit -être occupé
> actuellemnt.
> J'aimearis intervenir d'abord pour préciser les informations
données par Orou sur les
> transformations normalisatrices et ensuite pour poser une question
par rapport à ces
> transformations.
>
> A. Concernant le premeir volet, je suis d'accord avec Orou que le
choix du type de
> transformation dépend de l'allure que va prendre la courbe de
distribution des fréquence.Mais
> comme il l'a aussi dit le problème principal est quel type de
transformation effectuer
> autrement dit comment déterminer de façon pratique le type de
distribution? Je pense qu'il a
> commencé pas répondre au problème mais il est demeuré sur des
aspects un peu théorique.
> Ainsi une manière pratique de déterminer le type de distribution
est d'analyser les relations
> entre les moyennes et les variances des différents groupes comparés
ou alors les relations
> entre les moyennes et les écart-types. Pour cela on peut faire
recours à la regression
> linéaire. Les différents cas possibles sont:
>
> 1. Lorsque la moyenne est proportionnelle à la variance [(s2 = k.m
ou ln(s2) = ln(m) + ln (k)]
> et non forcément moyenne égale à la variance comme Orou l'a dit
(s2=m), nous ommes dans le cas
> d'une distribution poissonnienne et nous pouvons appliquer une
transformation racine carrée Y'
> = racine carrée (Y).
>
> 2. Lorsque par contre la moyenne est proportionnelle à l'écart-type
(ce qui est équivalent à
> moy au carré proportionnelle à variance) [ s2 = k.m2 ou ln (s2) =
2.ln (m) +ln (k)], vous êtes
> dans le cas plutôt d'une distribution contagieuse ou exponentielle.
La transformation
> logarithme convient mieux à ce niveau.
>
> 3. De façon, générale il faut toujours déterminer la pente de
l'équation de régression entre le
> logarithme de la moyenne et le logarithme des variances. Cette
relation sera toujours du type
> log (s2) = b.log (m) + log (k) avec b ~1 pour les distribution de
poisson et b~2 pour les
> distribution exponentiells. Vous appliquez tout simplement une
transformation du type Y'=Y exp
> (1-b/2).
>
> 4. Concernant la transformation arcsin de racine carrée de Y, le
problème ne se pose pas. Elle
> s'applique aux données sous forme de proportion et dont on peut
assimiler la distribution à une
> loi binomiale, pourvu que ces proportions soient déterminées à
partir d'une même base.
>
> Je précise que toutes ces informations et les détails des formules
appliquées se trouvent dans
> Dagnélie (1986, P.362-375).
>
> Nous devons pas aussi avoir peur des formules ou du travail
supplémentaire que demande toute
> ces procédures. Les différents logiciels nous offrent une grande
facilité dans la manipulation
> des formules
>
> B. J'aborde maintenant le second volet de mon intervention et qui
en fait est une question. Les
> transformations n'induisent-elles pas un biais dans le calcul des
paramètres de positions? Je
> m'explique: Etant donné que ce sont les variables transformées que
l'on soumet à l'ANOVA, les
> outputs de l'ANOVA nous donnent les valeurs des moyennes, des écart-
types et des intervalles de
> confiance de ces variables transformées. Il faille retourner aux
valeurs réelles par des
> transformations inverses [Y = f-1 (Y')]. Les valeurs issues de ces
transformations inverses
> sont toujours différentes des moyennes ou écart-types qu'on aurait
obtenus en utilisant
> directement les données non-transformées. Dans ces conditions, on
se demande qu'est-ce qui
> réelle? Devons considérer les valeurs obtenues à partir des
transformations inverses ou
> calculons-nous directement les paramètres de position à partir des
données originales? Je pense
> que Laurent Houessou doit partager avec moi cette inquiétude
puisque le
> problème s'est posé à nous une fois et il était vraiment réticent
par rapport aux résultats
> des transformations inverses. J'espère bien que vous arrivez tous à
me comprendre.
>
> Merci pour votre attention
>
>
>
>
> Hermane AVOHOU
> Ingénieur Agronome
> 04 BP 0419, Cotonou
> Cel: (229)061169
> h.avohou@c...
> avoher@y...
>
>
> ---------------------------------
> Découvrez le nouveau Yahoo! Mail : 250 Mo d'espace de stockage
pour vos mails !
> Créez votre Yahoo! Mail