Extension de l'ACPVI multibloc à la discrimination qualitative. Application en épidémiologie vétérinaire. Stéphanie Bougeard, El Mostafa Qannari et Christelle Fablet.
La revue MODULAD, numéro 41, 2010.
Résumé
Une
nouvelle présentation de l'Analyse en Composantes Principales sur
Variables Instrumentales Multibloc, dont l'objectif est de prédire un
tableau Y à partir de plusieurs tableaux (X_1, ..., X_K), est proposée.
Elle est basée sur la détermination, pas à pas, de composantes dans
l'espace des variables Y. Chaque composante est projetée sur les
espaces engendrés respectivement par les variables des tableaux X_k.
L'ACPVI multibloc consiste à maximiser, en moyenne, la variance
restituée par ces projections. Cette méthode multibloc est ensuite
appliquée au cadre de la description et la prédiction d'une variable
qualitative $y$ par un ensemble de variables qualitatives (x_1, ...,
x_K), chaque variable étant codée en un tableau contenant les
indicatrices de ses modalités. La discrimination est opérée sur la base
de composantes globales mutuellement orthogonales résumant l'ensemble
des variables explicatives. La démarche d'analyse est comparée à
d'autres méthodes de discrimination qualitative et illustrée sur la
base d'une étude de cas en épidémiologie vétérinaire.
Mots clés
Analyse canonique généralisée, analyse en composantes principales sur
variables instrumentales multibloc, analyse des correspondances
multiples avec un tableau de référence, discrimination qualitative
Abstract
A
new presentation of Multiblock Redundancy Analysis is discussed. This
method of analysis aims at predicting a set of variables Y from several
blocks of variables (X_1, ..., X_K). It consists in determining, step
by step, components in the Y space which are projected upon the spaces
spanned by the variables in X_k. At each step, the component is sought
in such a way so as to maximize the averaged variance explained by the
projections. Thereafter, the method of analysis is applied to the case
of categorical variables, each variable being coded by the indicators
of its categories. The discrimination and classification is achieved
using orthogonal components from the predictive variables. We also
outline how the method is related to other qualitative discriminant
techniques. The interest of the method is illustrated on the basis of a
case study in the field of veterinary epidemiology.
Key words
Generalized canonical analysis, multiblock redundancy analysis,
multiple correspondence analysis with a reference table, discrimination
with categorical variables
Article
|