Le Monde des Utilisateurs de L'Analyse de Données

Numéro 41

 
 

Sur l’utilisation conjointe de la régression sur composantes principales et des ondelettes. Salwa BENAMMOU, Nabiha HAOUAS et Zied KACEM. La revue MODULAD, numéro 41,  2010.

Résumé
La régression sur composantes principales (RCP) est une régression sur les facteurs d’une ACP préalablement effectuée sur des variables initialement corrélées. L’utilisation de l’ACP permet de remplacer les variables initiales, par des composantes principales qui conservent la quasi-totalité de l’information, et qui présentent l’avantage d’être non corrélées. Ces composantes, sont prises comme variables explicatives  pour une régression linéaire multiple. La qualité de la modélisation par RCP reste affectée par l’existence de bruit dans les variables initiales. Nous proposons dans ce travail un débruitage des données par ondelettes (wavelets) permettant de séparer le signal du bruit sans perte d’information. Nous montrons, sur des données boursières françaises, que l’élimination du bruit sur les composantes principales par un seuillage doux à base d’ondelettes améliore la qualité d’ajustement du modèle de régression ainsi que la qualité des prévisions. Nous confirmons le résultat par simulation.

Mots clés 
Ondelettes, Seuillage, RCP, ACP, débruitage, simulation

Abstract
The principal components regression (PCR) is an applied regression on PCA factors of a PCA beforehand carried out on initially strongly correlated variables. The use of the PCA allows replacing the initial variables, by principle components which preserve the quasi-total of information, and which present the advantage to be non-correlated. These components are taken as explanatory variables for a multiple linear regression. The PCR modeling quality remains affected by the existence of noise in the initial variables. In this work, we propose a denoising of the data by wavelets (thresholding) making possible separation of the signal from the noise without losing information.  We show using French stock-exchange data, that the elimination of the noise on the main constituents by a soft thresholding based on wavelets improves the quality of adjustment of the regression model as well as forecast quality. We confirm result by simulation.

Key words 
Wavelets, thresholding, PCR, PCA, denoising, simulation

Article