Sur l’utilisation conjointe de la régression sur composantes principales et des ondelettes. Salwa BENAMMOU, Nabiha HAOUAS et Zied KACEM.
La revue MODULAD, numéro 41, 2010.
Résumé
La
régression sur composantes principales (RCP) est une régression sur les
facteurs d’une ACP préalablement effectuée sur des variables
initialement corrélées. L’utilisation de l’ACP permet de remplacer les
variables initiales, par des composantes principales qui conservent la
quasi-totalité de l’information, et qui présentent l’avantage d’être
non corrélées. Ces composantes, sont prises comme variables
explicatives pour une régression linéaire multiple. La qualité de
la modélisation par RCP reste affectée par l’existence de bruit dans
les variables initiales. Nous proposons dans ce travail un débruitage
des données par ondelettes (wavelets) permettant de séparer le signal
du bruit sans perte d’information. Nous montrons, sur des données
boursières françaises, que l’élimination du bruit sur les composantes
principales par un seuillage doux à base d’ondelettes améliore la
qualité d’ajustement du modèle de régression ainsi que la qualité des
prévisions. Nous confirmons le résultat par simulation.
Mots clés Ondelettes, Seuillage, RCP, ACP, débruitage, simulation
Abstract
The
principal components regression (PCR) is an applied regression on PCA
factors of a PCA beforehand carried out on initially strongly
correlated variables. The use of the PCA allows replacing the initial
variables, by principle components which preserve the quasi-total of
information, and which present the advantage to be non-correlated.
These components are taken as explanatory variables for a multiple
linear regression. The PCR modeling quality remains affected by the
existence of noise in the initial variables. In this work, we propose a
denoising of the data by wavelets (thresholding) making possible
separation of the signal from the noise without losing
information. We show using French stock-exchange data, that the
elimination of the noise on the main constituents by a soft
thresholding based on wavelets improves the quality of adjustment of
the regression model as well as forecast quality. We confirm result by
simulation.
Key words
Wavelets, thresholding, PCR, PCA, denoising, simulation
Article
|