BASE

Biotechnologie, Agronomie, Société et Environnement/Biotechnology, Agronomy, Society and Environment

1370-6233 1780-4507

 

Facteur d'impact : 0,433

depuis le 05 février 2011 :
Visualisation(s): 23 (1 ULg)
Téléchargement(s): 0 (0 ULg)
print          
Arcadius Yves Justin Akossou & Rodolphe Palm

Conséquences de la sélection de variables sur l’interprétation des résultats en régression linéaire multiple

Article Open Access

Document(s) associé(s)

Annexes

Notes de la rédaction

Reçu le 30 mars 2004, accepté le 14 juillet 2004

Résumé

La sélection de variables, a priori ou a posteriori, est une pratique très courante en régression multiple. L’utilisateur n’est cependant pas toujours conscient des conséquences sur les résultats qu’induit cette sélection. Dans cette note, les notions de biais d’omission et de biais de sélection des variables sont illustrées à partir d’un exemple simulé. Les conséquences de la sélection des variables sur l’estimation des paramètres et sur les prédictions sont ensuite examinées. L’attention de l’utilisateur est attirée sur les risques d’interprétation abusive des coefficients de régression, particulièrement après sélection de variables. Par contre, les conséquences de la sélection des variables sur la qualité des valeurs prédites de la variable à expliquer sont assez limitées, du moins pour l’exemple examiné.

Mots-clés : méthode statistique, régression, sélection de variables, biais d’omission, biais de sélection, simulation

Abstract

Consequences of variable selection on the interpretation of the results in multiple linear regression

A priori or a posteriori variable selection is a common practise in multiple linear regression. The user is however not always aware of the consequences on the results due to this variable selection. In this note, the presence of omission bias and selection bias is explained by means of a Monte Carlo experiment. The consequences of variable selection on the regression coefficients and on the predicted values are then analysed. The user’s attention is drawn to the risk of misinterpretation of the regression coefficients, specially after variable selection. On the other hand, the consequences of variable selection on the predicted values of the response variable are rather limited, at least for the given example.

Keywords : statistical method, regression, variable selection, omission bias, selection bias, simulation

Pour citer cet article

Arcadius Yves Justin Akossou & Rodolphe Palm, «Conséquences de la sélection de variables sur l’interprétation des résultats en régression linéaire multiple», BASE [En ligne], volume 9 (2005), numéro 1, 11-18 URL : http://popups.ulg.ac.be/1780-4507/index.php?id=13847.

A propos de : Arcadius Yves Justin Akossou

Unité de Statistique et Informatique. Faculté universitaire des Sciences agronomiques de Gembloux. Avenue de la Faculté d’Agronomie, 8. B-5030 Gembloux (Belgique).

A propos de : Rodolphe Palm

Unité de Statistique et Informatique. Faculté universitaire des Sciences agronomiques de Gembloux. Avenue de la Faculté d’Agronomie, 8. B-5030 Gembloux (Belgique). E-mail : palm.r@fsagx.ac.be