Le Monde des Utilisateurs de L'Analyse de Données
Le PAC
Tanagra
Bibliothèque Modulad
 
 

Le coin des LOGICIELS

Dans cette page, la revue publie des informations sur les outils logiciels dédiés à la statistique et au Data mining, liens utiles, téléchargements, etc.

Le numéro 33 (juillet 2005) présente le logiciel LePAC essentiellemnt dédié aux procédures bayésiennes.

Le numéro 32 (janvier 2005) a présenté le logiciel libre TANAGRA dédié principalement aux techniques de Data mining.

On annonce la ré-édition de la bibliothèque historique des programmes FORTRAN de MODULAD dédiés à l'analyse des données.


Le logiciel "LePAC"

PAC "Programme d'Analyse des Comparaisons" est un programme général d'analyse de variance univariée et multivariée, incluant l'analyse de covariance, l'analyse de la régression polynômiale et l'analyse discriminante. Il est particulièrement adapté aux plans à mesures répétées, avec des effectifs de groupes égaux ou inégaux. PAC est un outil utilisable aussi bien pour une initiation au traitement des données expérimentales que pour des applications sophistiquées.

PAC fonctionne en mode interactif ou avec un un langage de demandes. L'utilisateur peut sélectionner les effets à analyser: effets principaux, d'interaction, partiels, conditionnels, intra, associés aux composantes de la régression polynômiale...

PAC effectue des analyses univariées et multivariées, descriptives et inférentielles, qui englobent les procédures traditionnelles (tests de signification) et les prolongent, d'une part en permettant d'abandonner les hypothèses habituelles d'égalité des variances-covariances, et d'autre part en apportant des conclusions sur l'importance réelle des effets (notamment dans le cadre de l'inférence bayésienne).

La documentation comporte:
      le guide d'utilisation Express;
      le guide d'utilisation des commandes;
      le manuel de référence.

Pour avoir une vue rapide sur le logiciel, on lira la présentation générale du logiciel. Pour une première évaluation de ce que le logiciel fait et comment il le fait, on lira la description d'un premier essai d'utilisation. Pour en savoir plus, on téléchargera une introduction au logiciel.

Le logiciel LePAC est développé par Bruno LECOUTRE (CNRS, UMR 6085) et Jacques POITEVINEAU (CNRS,UMR 7604). On téléchargera la dernière version sur le site:

http://www.univ-rouen.fr/LMRS/Persopage/Lecoutre/PAC.htm


Le logiciel "TANAGRA"

TANAGRA est un logiciel gratuit de Data mining destiné à l'enseignement, à la recherche et aux applications. Il implémente une série de méthodes de fouilles de données issues du domaine de la statistique exploratoire, de l'apprentissage automatique et des bases de données.

TANAGRA est un projet ouvert au sens qu'il est possible d'accéder au code et d'ajouter ses propres algorithmes sous réserve de respecter la licence de distribution du logiciel.

L'objectif principal du projet TANAGRA est d'offrir une plate-forme de Data Mining facile d'accès, respectant les standards des logiciels du domaine, notamment en matière d'interface et de mode de fonctionnement, et permettant de mener des études sur des données réelles et/ou synthétiques.

Le second objectif de TANAGRA est de proposer aux chercheurs une architecture leur permettant d'implémenter aisément les techniques qu'ils veulent étudier, de comparer les performances des algorithmes. TANAGRA se comporte plus comme une plate-forme d'expérimentation qui leur permettrait d'aller à l'essentiel en leur épargnant toute la partie ingrate de la programmation de ce type d'outil : la gestion des données.

Pour plus d'information, lire l'article de Ricco RAKOTOMALALA paru dans la Revue MODULAD, numéro 32 (janvier 2005).

Téléchargement et informations complètes en français sur le site :
http://eric.univ-lyon2.fr/~ricco/tanagra/fr/tanagra.html

Disponible aussi en anglais sur le site :
http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html


La bibliothèque historique FORTRAN d'analyse de données de MODULAD

(en travaux)

Mise en chantier dès 1988, cette bibliothèque de programmes écrits en FORTRAN couvre une vaste gamme de méthodes statistiques devenues pour la plupart des techniques classiques d'exploration ou de modélisation. Le code est commenté et fourni avec une documentation et des exemples d'utilisation. Ces caractéristiques rendent cette bibliothèque toujours utile, soit dans son code d'origine, soit pour des adaptations dans d'autres langages. Le FORTRAN reste un langage de programmation scientifique bien vivant ; vous en serez convaincu en tapant « FORTRAN » dans votre moteur de recherche préféré ou en allant par exemple à l'adresse http://www.fortran.com/.