Richesse et complexité des données fonctionnelles. Jean Frédéric FERRATY, Philippe VIEU. La revue MODULAD, numéro 43, 2011.
Résumé
Les
progrés récents en matière de stockage et de traitement des données se
traduisent de plus en plus fréquemment dans de nombreux domaines
scientifiques par la présence de données de type fonctionnel (courbes,
images, ...). Les défis proposés aux statisticiens pour appréhender ce
type de données ont abouti depuis quelques années à la construction de
nombreuses méthodes statistiques. Il se trouve que la complexité de ce
type de données amène une richesse d'information qu'une méthode
statistique (aussi sophistiquée soit elle) arrive difficilement à
capter, tandis que des techniques de boosting capables d'utiliser les
complémentarités de différentes méthodes se révèlent souvent plus
performantes. L'objectif de ce travail est d'illustrer ce point de vue
au travers d'un problème couramment rencontré en pratique: celui de la
prévision d'une variable réponse réelle à partir d'une variable
explicative fonctionnelle. Un rapide tour d'horizon des méthodes
habituellement utilisées sera effectué, et leur complémentarité sera
mise en évidence au travers d'un jeu de données issu d'un problème de
chimie quantitative.
Mots clés
Analyse
de données fonctionnelles, Boosting, Méthodes de sélection,
Modèles fonctionnels, Régression, Spectrométrie, Statistique
non-paramétrique.
Article
|