Several applications are based on the assessment of a linear model linking a variable y to predictors x 1 , x 2 ,..., x p . It often occurs that the predictors are collinear which results in a high instability of the model obtained by means of multiple linear regression. Several alternative methods have been proposed in order to tackle this problem. Among these methods Ridge Regression (RR), Principal Component Regression (PCR) and Partial Least Squares (PLS) are the most popular. We discuss another alternative method to Multiple Linear Regression (MLR) called Latent Root Regression (LRR). This method basically shares certain common characteristics with PLS as it derives latent variables to be used as predictors. Like PLS, the dependent variable plays a central role in determining the latent variables. We introduce new properties of latent root regression which give new insight into the determination of a prediction model. The mean squared error for the latent root estimator is explicitly given. Thus, a model may be determined by combining latent root estimators in such a way that the associated mean squared error is minimized. The method is illustrated using two real data sets.
La regression par analyse des valeurs latentes (Latent Root Regression) proposee par Webster, Gunst et Mason (1974) consiste a determiner des variables latentes a partir de l'analyse en composantes principales du tableau [y|X] (concatenation horizontale de y et du tableau des predicteurs). Par la suite, certaines variables latentes sont qualifiees comme relevant d'une quasi-colinearite predictive et d'autres d'une quasi-colinearite non predictive. Les premieres sont incluses dans l'equation de prediction et les dernieres sont ecartees. Il apparat des lors que la regression par analyse des valeurs latentes presente des similarites avec la methode PLS en ce sens qu'elle est basee sur une regression sur des variables latentes et, de plus, la determination des variables latentes tient compte aussi bien de la variable a predire que des variables predictives. Dans un premier temps, nous presentons la regression par analyse des valeurs latentes. Dans un deuxieme temps, nous montrons de nouvelles proprietes associees aux variables latentes qui peuvent aider l'utilisateur dans la determination d'un modele de prediction. Des exemples d'application sont discutes pour illustrer la methode.