Le Monde des Utilisateurs de L'Analyse de Données

Numéro 35

 
 

Le logiciel mixmod d'analyse de mélange pour la classification et l'analyse discriminante. Christophe BIERNACKI, Gilles CELEUX, Anwuli ECHENIM, Gérard GOVAERT, Florent LANGROGNET.
La revue MODULAD, numéro 35, Décembre 2006.

Résumé

Le logiciel mixmod est dévolu à l'analyse de mélanges de lois de probabilité sur des données multidimensionnelles dans un but d'estimation de densité, de classification ou d'analyse discriminante. Il propose un choix important d'algorithmes pour estimer les paramètres d'un mélange (EM, Classification EM, Stochastic EM). Il est possible de combiner ces algorithmes de multiples façons pour obtenir un maximum local pertinent de la vraisemblance ou de la vraisemblance complétée d'un modèle. Pour des variables quantitatives, mixmod utilise des mélanges de lois normales multidimensionnelles. Il propose ainsi quatorze modèles gaussiens différents selon des hypothèses faites sur les éléments spectraux des matrices de variance des composants. Pour des variables qualitatives, mixmod utilise des mélanges de lois multinomiales multidimensionnelles sous une hypothèse d'indépendance conditionnelle des variables sachant le composant du mélange. Grâce à une reparamétrisation des probabilités multinomiales, il propose cinq modélisations différentes. Par ailleurs, différents critères d'information sont proposés pour choisir un modèle parcimonieux et permettent notamment de choisir un nombre de composants pertinents. L'emploi de l'un ou l'autre de ces critères dépend de l'objectif poursuivi (estimation de densité, classification supervisée ou non). Écrit en C++, mixmod possède des interfaces avec Scilab et Matlab. Le logiciel, sa documentation statistique et son guide d'utilisation sont disponibles à l'adresse suivante :
http://www-math.univ-fcomte.fr/mixmod/index.php.

Mots-clés : modèles gaussiens, modèles multinomiaux, algorithmes de type EM, sélection de modèles.

Télécharger : Le logiciel mixmod d'analyse de mélange pour la classification et l'analyse discriminante.