Tr.: Re: EcoNews Re: Valeurs aberrantes?

5 views
Skip to first unread message

Irenikatche Akponikpe

unread,
Jun 13, 2006, 10:33:12 AM6/13/06
to biostat...@googlegroups.com
--- Dans ecofor...@yahoogroupes.fr, Orou "Gaou€  é" <ogaoue@y...>
a € ¦écrit€ ¦ :

Aloha,
Il devient interessant que la discussion sur les variances nous fait
glisser lentement vers des
applications thematiques telles que le pastoralisme. J'apprecie que
Laurent et Hermane aient
amene la discussion sur ce terrain et j'espere que les pastoraliste
vont prendre le bout et y
intervenir. A propos, Oscar est sur ce forum, Soulemane (pastoraliste
des champignons --
puisqu'il les coupes aussi!) est aussi la et autres.

Je pense qu'il faut eviter de tordre le cou au statistiques pour
eviter de reconnaitre la realite
des evenements. Je suis d'accord avec Laurent que lorsque nous
obtenons une valeur vraie mais qui
constitue un cas particulier d'observation, nous ne pouvons pas tout
de suite decider de
l'ecarter de la serie de donnee que nous avons. Dans le cas
particulier de la coupe de phytomasse
pour l'estimation de la productivite d'un paturage, il est tout afait
aise d'obtenir de cas
pareille, comme l'illustre Hermane. Cependant, l'erreur provient de
la maniere dont on a
echantillone et du dispositif d'etude utilise.

Je suis d'accord avec Hermane que la randomisation constitue un
element tres important dans
l'echantillonage. J'ajoute que trois elements sont fondamentales dans
l'elaboration d'un
dispositif et la collecte des donnees (qu'on soit en pastoralisme ou
en nutrition alimentaire, ou
en ethnoecologie, etc): (1) l'independance des groupes ou populations
etudiees, (2) la
randomisation et (3) la repetition. Lorsqu'on examine ces elements de
pret, on comprend tout de
suite que l'onjectif principale vise, c'est d'ontenir des VALEURS
REPRESENTATIVES du systeme que
nous testons ou qu'on veut decrire. Il s'agit de se donner le pouvoir
de GENERALISER notre
conclusion a un ensemble plus grand. Lorsque j'etudie la foret classe
de Ouenou Benou par exemple
et que j'echantillone toutes les forets claire de cette reserve, mes
conclusion ne peuvent etre
applicable qu'a cette foret seule et non a tout le Benin. Mais
lorsque j'echantillonne toute les
sortes de foret claire que j'ai au Benin a differente latitutde, je
peux generaliser mes
conclusions a tout le pays. ceci m'amene a parler du premier element
fondamentale:

(1) l'independance des groupes: lorsque j'etudie mes paturages et que
je choisi dans une savanne
arboree de l'okpara, deux sites de coupe de phytomasse ou j'ai
installe 10 placettes de coupes de
1 metre carree chacunes, je ne suis pas entrain de repeter
l'experiementation au niveau de la
savane arboree mais plutot de sous echantilloner ma savane arboree.
En fait il n'y a pas
independance des populations etudiees parce qu'il s'agit du meme
systeme. Pour avoir une
independance des populations, je dois aller trouver une autre savanne
arboree a un autre bout de
la ferme de l'okpara et y installer mes placettes. Il s'agit la
d'une vraie repetition a
l'echelle de la savanne arboree. As t'on besoin de 10 placettes
necessairement? et ces placettes
sont -elle des repetitions? oui et non! ces placettes ne sont pas des
repetitions et on a pas
necessairement besoin des dix placettes. En matiere de tableau de
contingences (et Come Romain et
autre me diront si I am wrong), le minimum de 5 pour les sous totaux
a ete recommande par
plusieurs auteurs que Zar Herrold reprend dans son livre (p 504).
Alors avec 5 placettes, on
pourra valablement sous echantillonner la savanne arboree. Mais
pourquoi est que tous les
pastoraliste sortis de la FSA utilisent 10 placettes a chaque fois?
je me le demande encore;...
peut etre que Sinsin a inspire et on a pas voulu savoir le reste!

(2) lorsque nos unites de coupes sont choisies et que nous avons 5 ou
10 placettes a installer et
couper pour sous echantilloner le sites de coupe, il est tres
important de selectionner au hazard
nos point de coupes pour eviter de choisir les sites les plus bons ou
les sites les plus mauvaix
(en terme de productivite). Le caractere bon ou mauvais ici sera
determine par le facteur etudie
(ici la productivite). Lorsque le choix des placettes est faite au
hazard, il n'y a pas de raison
de considerer des valeurs qui s'ecartent trop de la moyenne du groupe
comme des valeurs
aberrantes. Et c'est la que je joint Laurent dans son commentaire. Au
contraire, c'est ce choix
aleatoire que les statisticiens apprecient et qui les opposent
parfois aux ecologistes qui
n'arrivent pas toujours a operer la randomisation. Au niveau des
pastoralistes en generale, et
ceux de la FSA en particulier, je crois savoir que la randomization a
ete toujours effectuee, en
utlisant la methode fetiche de Sinsin qui consiste a delimiter un
placeau de 200x200 square meter
(si je ne me trompe) et la diviser en plusieurs carres de 1mx1m d'ou
on tire aleatoirement 10 a
chaque fois qu'on veut couper la phytomasse.
Au total, je pense que une proportions negligeable de valeurs tres
eloignee de la moyenne du
groupe (une ou deux valeurs sur une cinquantaine par exemple)
n'altereras pas l'homogeneite des
variances. La plupart du temps, l'inegalite de la taille des groupes
et la cacophonie dans les
methodes de mesures, la nature de la variable etudiees (par exemple
l'abondance d'une especes
dans plusieurs milieux) sont a la base des variances heterogenes. et
je pense que dans ce cas, et
lorsque la normalite est verifiee, il y a un autre type d'anova qui
est utilise. Je ne suis pas
trop sur mais je reviendrai la dessus si avant, les biometriciens du
groupe ne me l'ont pas
souffle sur ecoforum.

orou gaoue

--- Hermane AVOHOU <avoher@y...> wrote:

> Salut ,
> J'espère que c'est la pleine forme chez tout le monde. Je viens
juste apporter quelques
> éclaircissements aux questions posées par Laurent sur les valeurs
aberrantes dans le cas
> particulier du pastoralisme. J'espère que les autres arriveront à
me suivre.
> Je pense que nous devons faire attention à ne pas considérer la
statistique comme LAVELEYE pour
> qui la statistique est « … L'art de mentir mathématiquement » ou
comme MACAULEY pour qui «
> Les chiffres disent toujours ce que souhaite l'homme habile qui
sait en jouer ».
> La statistique ne ment pas pourvu que l'on respecte toutes les
hypothèses depuis les procédures
> d'échantillonge jusqu'aux tests statistiques.
> Le problème fondamental qui se pose en pastoralisme est celui de
l'hétérogénéité des
> populations/groupes qui en pastoralisme représentent au fait les
types de pâturage/des stations
> donnés :
> Si vous vous retrouvez dans une station et dans un placeau où vous
n'avez pas l'homogénéité de
> recouvrement au niveau de la strate herbacée, il est évident que
vous aurez une forte
> dispersion des valeurs surtout si vous vous retrouvez dans des
faciès avec des plaques de sols
> nus. Vous pouvez vous retrouvez ainsi dans le cas de figure que
Laurent a mentionné dans son
> raisonnement avec des valeurs de phytomasse variant de 4kg MS/ha à
1500kg MS/ha.
> D'un autre côté si vous appliquez mal un traitement par exemple un
feu qui brûle mal à un type
> de pâturage donné, originellement homogène, ce type de pâturage
devient dès lors hétérogène et
> les impacts se feront ressentir sur les valeurs de phytomasse qui
peuvent être aussi fortement
> dispersées.
> Un autre "péché" que les pastoralistes commettent le plus souvent ,
sur le terrain et que je
> condamne beaucoup est l'absence d'une procédure rigoureuse de
randomisation. Cette erreur
> méthodologique qui bien sûr facilite les collectes des données sur
le terrain lorsqu'on a une
> trentaine de placeaux à couper en peu de jours peut gravement
influer sur la dispersion des
> données.
> En résumé, dans le cas du pastoralisme, lorsque vous choisissez
correctement les faciès (éviter
> les écotones et avoir l'homogénéité de recouvrement au niveau de la
strate herbacée) lorsque
> vous déterminez et appliquez rigoureusement les traitements,
lorsque échantillonnez
> rigoureusement (randomisation), il n'y a pas de raison que vous
ayez une forte dispersion des
> données où des valeurs atypiques.
> J'espère bien que les collègues qui ont aussi une expertise en
pastoralisme pourront contribuer
> et nous éclairer d'avantage. J'en profite pour faire un clin d'oeil
à Oscar dont j'ai eu les
> nouvelles il y a très longtemps.
> Hermane
>
----------------------------------------------------------------------
----------------------------------------------------------------------
---
> Laurent Houessou a écrit:
>
> Bonjour à Tous,
>
> Très heureux de vous retrouvez sur cet espace de discussion. Je
> profite même pour saluer Gaoué et Biaou pour l'initiative.
> Je partage avec vous la problématique soulevée et discuter quand aux
> conditions d'application de l'ANOVA. Sans faire de la fausse
> modestie, j'avoue que ces conditions sont clairement énoncées par
nos
> enseignants et même Dagnélie reprend ces conditionnalités dans son
> livre (je n'ai pas les références exactes en tête). Il faut plutôt
> chercher aussi quelque part la faille dans nos rangs. J'avoue que
nos
> enseignants n'étaient pas très incisifs et très autoritaires sur ces
> conditions et ne nous montraient pas du doigt combien de fois on
> était en train de « pêcher » en occultant ces conditions (peut être
> que Moumoni dira le contraire)
> Sans vouloir faire retarder la discussion que je suis d'ailleurs
avec
> beaucoup d'intérêt, je voudrais avec votre permission revenir un
> temps soit peu sur le problème des valeurs dites aberrantes. Je suis
> d'accord avec toutes les méthodes proposées pour détecter et
éliminer
> ces valeurs. Mais mon inquiétude réside dans le fait des préjugés
> scientifiques que nous portons sur ces valeurs aberrantes. Je crois
> que l'on doit se poser aussi la question à savoir quelle est la
> source de ma valeur aberrante comme soulevée par Avohou. Est-ce que
> liée : 1) à la frappe lors de l'introduction de mes données à
> l'écran, 2) à une mauvaise transcription de ma valeur sur le
terrain,
> 4) à la non fidélité de mon appareil de mesure, 5) à une mauvaise
> manipulation de l'expérimentateur, 6) au dispositif expérimental, 7)
> à la nature des données collectées.
> Justement, si la source d'erreur concerne la nature des données
> collectées, de quelle légitimité jouirais je pour éliminer ces
> valeurs. Le cas que je connais le mieux est celui des données
> récoltées au niveau des pâturages naturels. Quand on procède à des
> coupes de phytomasse dans des pâturages, les valeurs peuvent
paraître
> tellement divergentes pour des répétitions d'un même traitement
> (pâturage) et on se demande où est le problème. Par exemple pour des
> répétitions d'un même traitement, vous trouvez après mesure 4
> kgMs/m², 650 kgMs/m², 1100 kgMs/m², 1500 kgMs/m², 750 kgMs/m², 350
> kgMs/m², 800 kgMs/m² comme valeur. Et puis bien de valeurs pour les
> autres traitements.
> Quand on soumet ces données à l'analyse de variances, on se rend
> compte que par exemple la valeur 4 est aberrante. Faut il l'éliminer
> alors que je suis bien conscient même depuis le terrain que je n'ai
> pas commis d'erreur sur ce chiffre. Et de quel droit urgerait pour
> l'éliminer. Pour quelle raison.
> Je me rappelle avoir fait des gymnastiques de tests de valeurs
> aberrantes avec Avohou pour éliminer ces valeurs qu'on qualifiait
> d'aberrantes même si je n'étais pas souvent convaincu. Je me suis
> toujours quelle est la légitimité de ce que je fais. Il me semblait
> qu'on voulait à tout prix faire dire aux chiffres ce qu'on vouloir
> qu'ils disent. Attention à ne pas déformer la réalité scientifique
ou
> la réalité des faits tels qu'elle se présente sur le terrain par
> élimination des valeurs jugées d'aberrantes.
>
> Je n'ai pas pu télécharger les cours du Dr Borcard Daniel, j'étais
> sur le site mais pour télécharger la page n'était pas disponible, je
> ne sais pas si d'autres collègues ont rencontré le même problème ou
> si le problème est de mon côté.
>
> Merci pour Romain pour les éclairssissements apportés.
>
> Pour Gaoué, je suis plus actuellement versé dans la Socio-Economie
de
> l'Environnement et Développement.
>
>
>
>
>
>
> Hermane AVOHOU
> Ingénieur Agronome
> 04 BP 0419, Cotonou
> Cel: (229)061169
> h.avohou@c...
> avoher@y...
>
>
> ---------------------------------
> Découvrez nos promotions exclusives "destination de la Tunisie, du
Maroc, des Baléares et la
> Rép. Dominicaine sur Yahoo! Voyages.

--- Fin du message transf€ ¦ér€ ¦é ---

Reply all
Reply to author
Forward
0 new messages