Tr.: Re: Valeurs aberrantes? Fwd: TR : The Statistics Homepage

60 views
Skip to first unread message

Irenikatche Akponikpe

unread,
Jun 13, 2006, 10:37:54 AM6/13/06
to biostat...@googlegroups.com
--- Dans ecofor...@yahoogroupes.fr, Hermane AVOHOU <avoher@y...> a
écrit :

Salut tout le monde,
Juste une petite contribution concernant les valeurs aberrantes. Je
vous transfert ci-dessous, une échange de mails que j'ai eu avec les
animateurs du goupe Statsoft en Décembre passé concernant le sujet.
Ces messages proposent d'autres méthodes descriptives pour répérer
les valeurs aberrantes et viennent ainsi augmenter la gamme de
méthodes déjà proposées par Enoch dans son dernier message sur le
sujet (analyse de la distribution des fréquences).
Je pense aussi qu'il n'existe pas de règle universelle pour
identifier les valeurs aberrantes. En plus des statistiques
descriptives par exemple les distribubutions de fréquences comme l'a
illustré Enoch, des diagrammes de corrélation commme indiqués ci-
dessous dans ce message et des tests statistiques comme le test de
Grubbs décrit par Dagnelie (1986, P34), il faut tenir compte
des "paradigmes expérimentaux spécifiques" et/ou des "pratiques
courantes", ainsi que des "expériences de recherche générale dans le
domaine correspondant" et aussi comme l'a dit Enoch de la méthode
suivie et du dispositif utilisé. Enoch a donné un fabuleux exemple
concernant le Projet bananier au Bénin, exemple que Gaoué a aussi
bien commenté et qui met en cause la manière dont les données ont été
collectées dans le cas spécifique de ce projet. Il s'agit là d'un cas
palpable de données aberrantes.

Ciao


-----Message d'origine-----
De : Olivier Lebret [mailto:olebret@s...]
Envoyé : mardi 7 décembre 2004 17:13
À : h.avohou@c...
Objet : Fw: The Statistics Homepage

Cher Monsieur,



Je vous remercie pour l'intérêt que vous portez à notre programme.
Pour répondre à votre question, je vous prie de bien vouloir trouver
ci-dessous deux rubriques du Manuel Électronique de STATISTICA qui
devraient permettre de répondre à votre question. A l'avenir, merci
d'envoyer directement vos questions à france@s... pour une réponse
plus rapide,



Bien cordialement,



Olivier LEBRET


StatSoft France



"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""
Business Intelligence - Contrôle Qualité - Data Mining
Analyse des Données et Statistiques par le Web
"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""
StatSoft France Tel. : 01-45-185-999
31, cours des Juilliottes Fax : 01-45-185-285
94700 Maisons-Alfort FRANCE
E-mail: france@s...
WEB: http://www.statsoft.fr
"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""
* StatSoft France est le distributeur exclusif des produits
STATISTICA en France et dans les pays francophones




Corrélations - Introduction - Points Atypiques

Les points atypiques sont (par définition) des
observations "aberrantes" et rares. De par le mode de calcul de la
droite de régression (plus précisément, la droite de régression se
calcule par minimisation non pas de la somme des distances simples,
mais de la somme des carrés des distances des points à la droite de
régression), les points atypiques influencent fortement la pente de
la droite et donc le coefficient de corrélation. Un seul point
atypique peut modifier considérablement la pente de la droite de
régression et donc la valeur de la corrélation. Remarque : comme le
montre l'illustration, un seul point atypique peut être à lui seul
responsable d'une corrélation qui (une fois ce point supprimé) serait
proche de zéro. Il est inutile de dire qu'il ne faut pas baser
d'importantes conclusions sur la valeur du coefficient de corrélation
uniquement (l'examen des nuages de points respectifs est toujours
recommandée).

Remarque : Si la taille de l'échantillon est relativement petite,
alors le fait d'inclure ou d'exclure les valeurs des points
spécifiques qui ne sont pas clairement "atypiques", comme illustré
par l'exemple précédent, pourrait influer sur la droite de régression
(et les coefficient de corrélation). Dans l'illustration suivante
nous appellerons les points à exclure des valeurs "atypiques" ; on
peut cependant considérer que ces points atypiques sont
vraisemblablement des valeurs extrêmes.

Plus précisément, on croit que les points aberrants représentent une
erreur aléatoire qu'on souhaiterait pouvoir contrôler.
Malheureusement, il n'existe pas de méthode universelle permettant de
supprimer automatiquement les points aberrants (voir toutefois la
rubrique Approche Quantitative des Points Aberrants). Un outil
pratique pour identifier les points atypiques est un nuage de points
des corrélations.

Notez que les options graphiques de l'onglet Avancé/Tracé de la boîte
de dialogue Matrices de Corrélations et les fonctions d'édition
graphique offrent de nombreuses possibilités pour supprimer
interactivement des points aberrants ("habillage"), pour visualiser
instantanément leur influence sur la droite de régression.

Inutile de dire que les points aberrants peuvent non seulement
augmenter artificiellement la valeur d'un coefficient de corrélation,
mais ils peuvent aussi diminuer la valeur d'une
corrélation "légitime".


Corrélations - Introduction - Approche Quantitative des Points
Aberrants


Certains chercheurs utilisent des méthodes quantitatives pour exclure
les points aberrants. Par exemple, ils éliminent toute observation se
situant à l'extérieur de l'intervalle ± 2 fois l'écart-type (parfois
même ± 1,5 fois l'écart-type) autour de la moyenne du groupe ou de la
cellule du modèle. Dans certains domaines de recherche,
ce "nettoyage" des données est absolument nécessaire. Par exemple,
dans la recherche en psychologie cognitive sur les temps de réaction,
même si la plupart des résultats d'une expérience sont compris dans
l'intervalle 300 à 700 millisecondes, quelques "réactions atypiques"
de 10 à 15 secondes peuvent modifier complètement la structure
d'ensemble. Malheureusement, décider qu'un point est atypique est
parfaitement subjectif et il n'existe pas de règle universelle pour
les identifier (il faut tenir compte des paradigmes expérimentaux
spécifiques et/ou des "pratiques courantes", ainsi que des
expériences de recherche générale dans le domaine correspondant).
Notez que dans certains cas rares, la fréquence relative des points
aberrants sur un certain nombre de groupes ou cellules d'un modèle
peut être analysée et fournir des résultats interprétables. Par
exemple, des points aberrants peuvent mettre en évidence un phénomène
qualitativement différent de la structure type qui est observée ou
attendue dans l'échantillon ; c'est pourquoi la fréquence relative
des points aberrants peut montrer l'existence d'un écart du processus
ou du phénomène qui est commun à la plupart des observations d'un
groupe.


-----Original Message-----
From: Avohou, Hermane (IPGRI-Benin) [mailto:h.avohou@c...]
Sent: Tuesday, December 07, 2004 4:25 AM
To: stathome@s...
Subject: The Statistics Homepage


Chers amis de Statsoft,


J'espère que vous vous portez bien. Il ya un problème que je
rencontre souvent lors du traitement de mes données. Il s'agit des
valeurs aberrantes. Il m'arrive de soupçonner souvent que certaines
valeurs de mes séries de données soient aberrantes et pourraient
biaisaer mes résultats ou induire une forte dispersion des données.
Mais je manque souvent de critères fiables pour apprécier si une
valeur observée est réellemnt aberrante ou non. Avez-vous des
critères à me prposer ou existe-il des test statistiques permettant
de purger des données aberrantes d'une série d'observations?


Je vous suis infiniment reconnaissant de votre aide et de l'attention
que vous accordez à ma question


A bientôt


Hermane



--------------------------------------------------------------------

Hermane AVOHOU,

Scientific Assistant,

IPGRI-WCA, Cotonou, Bénin

Email: h.avohou@c... or avoher@y...


Hermane AVOHOU
Ingénieur Agronome
04 BP 0419, Cotonou
Cel: (229)061169
h.avohou@c...
avoher@y...


---------------------------------
Découvrez nos promotions exclusives "destination de la Tunisie, du
Maroc, des Baléares et la Rép. Dominicaine sur Yahoo! Voyages.

--- Fin du message transféré ---

Reply all
Reply to author
Forward
0 new messages