Le Monde des Utilisateurs de L'Analyse de Données

Numéro 38

 
 

La régression Partial Least-Squares boostée. Jean-François DURAND. La revue MODULAD, numéro 38, 2008.

Résumé
Ce papier présente la régression Partial Least-Squares (PLS) comme appartenant à la famille de méthodes de boosting à fonction coût L2. D'une part, la régression PLS linéaire classique appartient à cette catégorie en considérant une variable latente ou composante principale comme base d'apprentissage (base learner) rendant robuste le modèle face au problème de la rareté des données et de la multi-corrélation des variables. D'autre part, l'usage des B-splines et de leurs produits tensoriels dans la construction de la base d'apprentissage, exploite de façon naturelle le potentiel du boosting L2 de PLS pour produire des modèles non-linéaires additifs qui capturent les effets principaux ainsi que les interactions significatives. La performance du boosting PLS en régression comme en classification supervisée est montrée sur trois exemples.

Abstract
This paper presents the Partial Least-Squares regression (PLS) in the framework of the boosting methods with L2 loss. First, the ordinary PLS regression already belongs to that family by considering the latent variables or principal components as base learners producing robust linear models that overcome the problems of the scarcity of the observations as well as the multi-collinearity of the predictor variables. Most of all, the use B-splines and their tensor products to construct the base learner, typically provides PLS with L2-boosts leading to non-linear additive models that capture main effects as well as relevant interactions.
The performances of the different PLS boosts in both regression and classification are shown on three exemples.

Mots clés 
Boosting, Partial Least-Squares, B-splines, Produits Tensoriels.

Keywords
Boosting, Partial Least-Squares, B-splines, Tensor Products.

Article