Le
coin des LOGICIELS
Dans cette page, la revue publie des informations
sur les outils logiciels dédiés à la statistique
et au Data mining, liens utiles, téléchargements,
etc.
Le numéro 33 (juillet 2005) présente
le logiciel LePAC essentiellemnt
dédié aux procédures bayésiennes.
Le numéro 32 (janvier 2005) a présenté
le logiciel libre TANAGRA
dédié principalement aux techniques de Data mining.
On annonce la ré-édition de la bibliothèque
historique des programmes FORTRAN de MODULAD dédiés
à l'analyse des données.
Le logiciel "LePAC"
PAC "Programme d'Analyse des
Comparaisons" est un programme général d'analyse de variance
univariée et multivariée, incluant l'analyse de covariance, l'analyse
de la régression polynômiale et l'analyse discriminante. Il est
particulièrement adapté aux plans à mesures répétées, avec des effectifs
de groupes égaux ou inégaux. PAC est un outil utilisable
aussi bien pour une initiation au traitement des données expérimentales
que pour des applications sophistiquées.
PAC fonctionne en mode interactif ou avec un un
langage de demandes. L'utilisateur peut sélectionner les effets
à analyser: effets principaux, d'interaction, partiels, conditionnels,
intra, associés aux composantes de la régression polynômiale...
PAC effectue des analyses univariées et multivariées, descriptives
et inférentielles, qui englobent les procédures traditionnelles
(tests de signification) et les prolongent, d'une part en permettant
d'abandonner les hypothèses habituelles d'égalité des variances-covariances,
et d'autre part en apportant des conclusions sur l'importance réelle
des effets (notamment dans le cadre de l'inférence bayésienne).
La documentation comporte:
le guide d'utilisation Express;
le guide d'utilisation des
commandes;
le manuel de référence.
Pour avoir une vue rapide sur le logiciel, on lira
la présentation
générale du logiciel. Pour une première
évaluation de ce que le logiciel fait et comment il le fait,
on lira la
description d'un premier essai d'utilisation. Pour en savoir
plus, on téléchargera une introduction
au logiciel.
Le logiciel LePAC est développé
par Bruno LECOUTRE (CNRS, UMR 6085) et Jacques POITEVINEAU (CNRS,UMR
7604). On téléchargera la dernière version
sur le site:
http://www.univ-rouen.fr/LMRS/Persopage/Lecoutre/PAC.htm
Le logiciel "TANAGRA"
TANAGRA est un logiciel gratuit de Data mining destiné
à l'enseignement, à la recherche et aux applications.
Il implémente une série de méthodes de fouilles
de données issues du domaine de la statistique exploratoire,
de l'apprentissage automatique et des bases de données.
TANAGRA est un projet ouvert au sens qu'il est possible d'accéder
au code et d'ajouter ses propres algorithmes sous réserve
de respecter la licence de distribution du logiciel.
L'objectif principal du projet TANAGRA est d'offrir une plate-forme
de Data Mining facile d'accès, respectant les standards
des logiciels du domaine, notamment en matière d'interface
et de mode de fonctionnement, et permettant de mener des
études sur des données réelles et/ou
synthétiques.
Le second objectif de TANAGRA est de proposer aux chercheurs une
architecture leur permettant d'implémenter aisément
les techniques qu'ils veulent étudier, de comparer les performances
des algorithmes. TANAGRA se comporte plus comme une plate-forme
d'expérimentation qui leur permettrait d'aller à
l'essentiel en leur épargnant toute la partie ingrate de
la programmation de ce type d'outil : la gestion des données.
Pour plus d'information, lire l'article
de Ricco RAKOTOMALALA
paru dans la Revue MODULAD, numéro 32 (janvier 2005).
Téléchargement et informations complètes en
français sur le site :
http://eric.univ-lyon2.fr/~ricco/tanagra/fr/tanagra.html
Disponible aussi en anglais sur le site :
http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html
La bibliothèque
historique FORTRAN d'analyse de données de MODULAD
(en travaux)
Mise en chantier dès 1988, cette bibliothèque de
programmes écrits en
FORTRAN couvre une vaste gamme de méthodes statistiques
devenues pour la plupart des techniques classiques d'exploration
ou de modélisation. Le code est commenté et fourni
avec une documentation et des exemples d'utilisation. Ces caractéristiques
rendent cette bibliothèque toujours utile, soit dans son
code d'origine, soit pour des adaptations dans d'autres langages.
Le FORTRAN reste un langage de programmation scientifique bien vivant ;
vous en serez convaincu en tapant « FORTRAN »
dans votre moteur de recherche préféré ou en
allant par exemple à l'adresse http://www.fortran.com/.
|