|
Habituellement
la description de ces entités se fait par des données quantitives ou
qualitatives entrant dans le carcan des tableaux de données classiques
permettant ainsi de les analyser par les logiciels standards. On perd alors
la variation interne inéluctable à ce type d'entité. Par exemple, on ne
décrit pas un insecte comme son espèce, un sportif comme son équipe,une
feuille de maladie comme un assuré (caractérisé par ses feuilles de maladies
sur une période). Afin
de tenir compte de cette variation, les variables habituelles doivent être
transformées en variables à valeur intervalle, histogramme, suites de valeurs
parfois pondérées et munies de règles et de taxonomies etc. Ces données ne
peuvent être traitées comme des nombres et sont donc dites
"symboliques". L'Analyse des données Symboliques et son logiciel
public SODAS (développé par deux projets européens soutenus par EUROSTAT) a
pour but de les analyser en étendant les méthodes habituelles de la
statistique, de l'Analyse des données exploratoires et du Data Mining à ce
type de données. Les
grands principes de ce domaine seront présentés ainsi que ses perspectives de
recherche et d'applications. |