Le Monde des Utilisateurs de L'Analyse de Données

Numéro 33

 
 

La régression PLS 1, cas particulier de la régression linéaire séquentielle orthogonale (RLSO)
Jacques GOUPY.
La revue MODULAD, numéro 33, juillet 2005

Résumé
La régression linéaire classique fournit une seule solution souvent basée sur le critère des moindres carrés. Lorsqu’il y a beaucoup de variables, on risque d’obtenir un modèle surparamétré, c’est-à-dire modélisant les erreurs. Pour éviter cette surparamétrisation, la régression PLS a été introduite car, étant une régression séquentielle, elle permet d’arrêter le processus de régression avant de modéliser l’erreur. Mais la PLS ne propose que quelques solutions et ne permet pas  vraiment d’optimisation. Nous proposons dans cet article une régression séquentielle orthogonale plus souple que la PLS, la régression linéaire séquentielle orthogonale ou RLSO. Cette régression permet d’éviter la surparamétrisation et elle facilite l’optimisation de la modélisation car les directions de projection peuvent être choisies au mieux des intérêts de l’étude. Les solutions possibles proposées par la RLSO sont en nombre infini. Ce qui laisse la possibilité d’utiliser toutes les techniques d’optimisation pour trouver la ou les meilleures solutions. Comme la régression linéaire séquentielle orthogonale (RLSO) est nouvelle, nous avons développé toutes les étapes de calcul. Un exemple numérique est fourni en annexes 9 et 10.

Mots clés 
régression séquentielle, régression PLS1, régression orthogonale

Télécharger : La régression PLS 1, cas particulier de la régression linéaire séquentielle orthogonale
Télécharger : Exemples numériques en Annexe 9 et 10 (fichier Excel au format Zip).

Abstract
The classical linear regression provides just one solution often based on the least squares criterion. When there are many variables, one can obtain a model with too many surparameters and consequently a model which modelize the error. To avoid such a parametrization, the PLS regression has been introduced. PLS is a sequential regression and it enables to stop the regression process before the error modelling. But the PLS regression has only a few numbers of solutions and the optimization is not really possible. It is why a new type of sequential regression is proposed in this article: the sequential orthogonal linear regression or SOL regression. It is much more versatile than the PLS ; it enables to avoid surparametrization and facilitate the modelling optimization because the directions of projection can be chosen at the best for the study. The number of the solutions proposed by the SOL regression is infinite and all the techniques of optimization can be used. As the SOL regression is new, all the calculations have been largely explained. Numerical example is given in Annex 9.

Key words
sequential regression, PLS1 regression, orthogonal regression

Download : La régression PLS 1, cas particulier de la régression linéaire séquentielle orthogonale

Download : Numerical examples in annex 9 and 10 (Zip file)