- Home
- volume 9 (2005)
- numéro 1
- Traitement des valeurs aberrantes : concepts actuels et tendances générales
View(s): 1093 (6 ULiège)
Download(s): 4428 (15 ULiège)
Traitement des valeurs aberrantes : concepts actuels et tendances générales
Editor's Notes
Reçu le 27 avril 2004, accepté le 7 janvier 2005
Résumé
En raison de l’évolution rapide des moyens de collecte automatique des données et de leur traitement informatique, le problème des valeurs aberrantes a pris une importance non négligeable durant les dernières décennies. Par exemple, le développement des systèmes d’informations géographiques, de l’agriculture de précision et de la capture automatique de données a entraîné la constitution de grands ensembles de données où les valeurs anormales peuvent plus facilement passer inaperçues. La présence de valeurs anormales peut alors conduire à des estimations biaisées des paramètres des populations et, suite à la réalisation de tests statistiques, à une interprétation des résultats qui peut être erronée. Cet article met en évidence la diversité des méthodes disponibles pour l’utilisateur et met l’accent sur la manière de traiter les valeurs aberrantes de façon structurée. Malgré des fondements théoriques très largement développés et une bibliographie très abondante sur le sujet, on constate que la plupart des logiciels statistiques existant sur le marché sont très limités quant au traitement des valeurs aberrantes.
Abstract
Treatment of outliers: present state of concepts and general tendencies
The fast evolution of data collection means and the computerised treatment of information induced a huge problem of outliers during last decades. For example, development of geographic information systems, precision farming and automatisation of data capture led to the constitution of large databases where outliers can more easily go unnoticed. The presence of abnormal values may lead to biased estimations of parameters of populations and, further to the realization of statistical tests to interpretation of results, which can be erroneous. This article highlights the diversity of available methods and emphasizes the way of handling outliers in a structured way. In spite of very widely developed theoretical concepts and a large bibliography on the subject, we notice that most of existing statistical software packages on the market are very limited for the treatment of outliers.