Le Monde des Utilisateurs de L'Analyse de Données

Numéro 37

 
 

Détermination du nombre optimal de classes présentant un fort degré de chevauchement. O. AMMOR, N RAISS, K. SLAOUI.
La revue MODULAD, numéro 37, Novembre 2007.

Résumé

RÉSUMÉ : Dans cet article, nous présentons un nouvel indice pour la détermination du nombre optimal et correct de classes nommé VMEP basé sur le Principe du Maximum d’Entropie. Les performances de ce nouvel indice déduit d’une combinaison originale entre des méthodes d’analyse des données et le critère du maximum d’entropie, sont montrées à travers un ensemble d’exemples simulés et réels. La procédure est complètement automatique dans le sens qu’elle ne nécessite aucun paramètre de réglage. VMEP montre une grande robustesse, et une supériorité par rapport à d’autres indices déjà existants et assez récents, particulièrement dans le cas du chevauchement spatial entre classes.

Abstract

In this paper, we propose a new and efficient clusters validity measure named VMEP for determination of the optimal and correct number of clusters based on the maximum entropy principle. The performance of this new index which has been shown in by many simulated and real examples is deducted from original combination of data analysis methods and the maximum entropy principle criterion. The method does not require any parameter adjustment, it is then completely automatic. Our new index VMEP shows high robustness and superiority to the existing and recent ones, especially in overlapping clusters case.

Mots-clés : Classification non supervisée, Principe du Maximum d’Entropie, chevauchement de classes, nombre optimal de clusters.

Keywords : unsupervised classification, the maximum entropy principle, overlapping clusters, optimal number of clusters.

Télécharger : Détermination du nombre optimal de classes présentant un fort degré de chevauchement.