|
Les
actualités du traitement des données
L'actualité des méthodes et des outils pour l'exploitation
de l'information
Agenda des manifestations
OCTOBRE 2008
International workshop on Data Stream Management
and Mining
Location: Beijing, China.
Dates : Oct. 30-31, 2008.
JANVIER
2009
9èmes Journées Francophones "Extraction
et Gestion des Connaissances", Strasbourg-France,
27 au 30 Janvier.
https://lsiit.u-strasbg.fr/egc09/index.php/Accueil
Dans le prolongement des huit éditions
précédentes, EGC 2009 ambitionne de regrouper chercheurs,
industriels et utilisateurs francophones issus des communautés
Bases de Données, Apprentissage, Représentation des
Connaissances, Gestion de Connaissances, Statistique et Fouille
de données. Aujourd'hui, de grandes masses de données
structurées ou semi-structurées sont accessibles
dans les bases de données d'entreprises ainsi que sur la
toile. Aussi les entreprises ont-elles besoin de méthodes
et d'outils capables de les acquérir, de les stocker, de
les représenter, de les indexer, de les intégrer,
de les classifier, d'extraire les connaissances pertinentes pour
les décideurs et de les visualiser. Pour répondre à cette
attente, de nombreux projets de recherche se développent
autour de l'extraction de connaissances à partir de données
(Knowledge Discovery in Data), ainsi que sur la gestion de connaissances
(Knowledge Management).
L'objectif de ces journées
est de rassembler, d'une part les chercheurs des disciplines
connexes (apprentissage, statistique et analyse de données,
systèmes d'information et bases de données, ingénierie
des connaissances, etc.), et d'autre part les spécialistes
d'entreprises qui déploient des méthodes d'extraction
et de gestion des connaissances, afin de contribuer à la
formation d'une communauté scientifique dans le monde
francophone autour de cette double thématique de l'extraction
et de la gestion de connaissances.
MARS 2009
http://www.ifcs2009.de/
IFCS 2009 - International Federation of
Classification Societies 2009, Dresden- Allemagne, March 13-18.
The 11th Biennial Conference of the International
Federation of Classification Societies (IFCS) will take place at
the University of Technology of Dresden, Germany, March 13-18,
2009, in combination with the 33rd annual conference of the German
Classification Society - Gesellschaft für Klassifikation (GfKl).
The conference will focus
on classification and data analysis as tools for research in
various applications. The scientific program will include sessions
with invited talks and contributed presentations from a broad
range of topics. Special emphasis will be laid on interdisciplinary
research and the interaction between theory and practice. Researchers
and practitioners are kindly invited to submit papers for presentation.
SEPTEMBRE 2009
http://www.pls09.org/
PLS 2009 - Partial Least Squares
2009, Beijing- Chine, September 4-7.
The 6th International Conference on Partial Least
Squares and Related Methods (PLS'09) will take place in Beijing
(China) on September 4th -7th, 2009. PLS'09 focuses on research
in Management, Engineering and Life Sciences.This conference is
a unique event through which outstanding experts in PLS methods,
from all over the world, can meet and communicate.
During the four
day meeting, experts from different countries and regions will
present their state-of-art and up-to-date research
on the PLS methods, which will reflect challenging advances in
this fields for the 21st century. The PLS techniques will be compared
with other typical methods and empirical applications to real data
will be performed. The Symposium will provide participants with
different insights on both theoretical and practical aspects of
PLS and related methods. Furthermore, the symposium will be also
precious chance and platform for academic scholars and specialized
professionals to meet and talk on their own interests in versatile
fields where PLS can be applied to.
AUGUST 2010 :
COMPSTAT
2010 - International Conference
on Computational Statistics August 23-27.
The 19th Symposium of
the European Regional Section of the IASC, COMPSTAT 2010, to
be held in the premises
of Conservatoire National des Arts et Métiers (CNAM) in
Paris.
Besides the main Conference, a satellite meeting or a tutorial
will be organized at INRIA Rocquencourt Research Unit, a campus
near Versailles at a few kilometres from Paris.
Information: Gilbert Saporta
E-mail: info@compstat2010.fr
Cycle
de conférence "Jean-Pierre
Fénelon" sur l'analyse multidimensionnelle des données
statistiques Télécharger
le programme ici.
Autres : manuels lus (Dominique
DESBOIS)
Ré-édition : Statistique
théorique et appliquée de Pierre Dagnelie
tome 2
(exercices en R disponibles).
A tous les lecteurs de la revue de Modulad,
en particulier à ceux
qui suivent avec attention les travaux de Pierre Dagnelie, signalons
les éléments suivants : le tome 2 de "Statistique
théorique et appliquée" vient de faire l'objet
d'une réédition (734 pages, ISBN 2-8041-5229-4),
brièvement présentée àl'adresse <www.dagnelie.be/stpres.html>;
cette nouvelle édition du tome 2 présente, par rapport à l'édition
de 1998, un nombre important de modifications, y compris une mise à jour
complète de la documentation bibliographique. Une idée
précise du contenu de ce livre peut être obtenue en
téléchargeant, en format PDF, la table des matières,
l'index des matières et/ou les introductions des différents
chapitres aux URL suivantes
<
www.dagnelie.be/docpdf/st2table.pdf>,
<
www.dagnelie.be/docpdf/st2index.pdf> et
<
www.dagnelie.be/docpdf/st2chap.pdf>.
- les solutions d'un certain nombre d'exercices
de ce livre, préparées à
l'aide du logiciel R par Emmanuel Nowak, sont disponibles à l'adresse
<
www.dagnelie.be/stlogr.html>;
- le texte intégral du livre "Principes d'expérimentation:
planification des expériences et analyse de leurs résultats",
et les solutions R de ses exercices, sont toujours disponibles
aux adresses
<
www.dagnelie.be/expres.html> et <www.dagnelie.be/exlogr.html>.
Rappelons que les deux tomes de "Statistique théorique
et appliquée" ont remplacé en 1998 les volumes
du traité "Théorie et méthodes statistiques",
très largement diffusés à partir de 1969-1970.
Une nouvelle édition du tome 1 doit paraître prochainement. "Statistique
théorique et appliquée" est publié par
les éditions De Boeck et diffusé par sa société associée
Accès+, cf. <www.deboeck.com>, respectivement <acces+cde@deboeck.be>.
"Introduction aux Plans d'expériences" de
Jacques Goupy et Lee Creighton.
<http://www.dunod.com/pages/ouvrages/ficheouvrage.asp?id=49744>.
Si l'ancienne version de cet ouvrage ne traitait que des plans
factoriels complets et fractionnaires, cette édition s’enrichit
de nouvelles extensions (plans pour surfaces de réponses,
plans de mélanges, plans D-optimaux, plans pour variables
discrètes) avec pour ambition de présenter les applications
actuelles des plans d'expériences.
Ce livre est accompagné d'un logiciel permettant de réaliser
pendant une période d’essai (6 mois) les calculs de
ses propres plans en vue d’applications. Le manuel d'utilisation
du logiciel et les exemples du livre sont téléchargeables
sur : < http://www.plansdexperiences.com/>.
Correspondence Analysis and Data Coding with Java and R
Fionn Murtagh
Avant-propos de Jean-Paul Benzécri
Chapman & Hall / CRC, 230 p., 2005.
L’ouvrage de Fionn Murtagh constitue une introduction de
langue anglaise très complète à la mise en œuvre
de l’analyse des correspondances à partir d’outils
récents. Elle n’est certes pas la première
mais son originalité est d’exposer cette méthodologie à partir
d’exemples basés sur l’utilisation du langage
Java et, de façon plus essentielle, du logiciel libre R.
Parmi les autres originalités de cet ouvrage, il faut citer
un avant-propos de Jean-Paul Benzécri, fait d’autant
plus rare qu’il mérite d’être signalé,
où celui-ci revient sur son parcours de statisticien géomètre.
Ce texte présenté à la fois en anglais et
en français permettra ainsi à un plus grand nombre
d’apprécier pleinement la saveur de cette rétrospective
dont l’objet est en réalité de se saisir des
questions du futur…
Pour revenir au travail de Fionn Murtagh, le premier chapitre revisite
depuis Galton et Quetelet les développements les plus remarquables
ayant abouti aux outils dont les statisticiens disposent aujourd’hui.
Cette introduction reprend à grands traits les linéaments
de l’ouvrage intitulé « Histoire et préhistoire
de l’Analyse des données » rendant ainsi accessible
aux lecteurs non francophones la perpective tracée par Jean-Paul
Benzécri dans ce champ. Les commentaires originaux de Fionn
Murtagh guident le lecteur vers les développements consacrés à l’analyse
des correspondances tout en les situant vis à vis des autres
travaux, mobilisant sa connaissance intime de cette méthodologie
ainsi qu’une culture statistique que l’on devine très étendue.
Une présentation introductive de l’analyse en composantes
principales et de l’analyse des correspondances, assortie
des fonctions logicielles associées, conclut ce premier
chapitre.
Le chapitre suivant est une présentation théorique
de l’analyse des correspondances et de la classification
hiérarchique, basée sur le système de notation
tensorielle privilégié par Jean-Paul Benzécri
dans ses exposés. Cette partie de l’ouvrage présente également
les concepts de distance et d’inertie qui sont associés à ces
développements ainsi que les grandes familles de méthode
de la classification automatique.
Le troisième chapitre, dans la démarche méthodologique
propre à l’Analyse des données, insiste sur
l’importance théorique du codage et ses implications
pratiques, présentant les différentes stratégies
de recodage, du codage disjonctif complet à la théorie
des possibilités en passant par les techniques du codage
flou, du codage barycentrique et des fonctions splines.
Le quatrième chapitre est consacré à la présentation
des diverses applications de l’analyse des correspondances
qu’il s’agisse d’archéologie basée
sur la morphométrie (gobelets thaï, craniométrie)
ou d’économie (commerce international des phosphates)
voire d’analyse financière. Chacune de ces études
permet à l’auteur d’insister sur l’importance
des fonctions d’aides à l’interprétation
en analyse des données pour qualifier les axes ou bien les
classes obtenus, fonctions présentées sur la base
de modules spécifiques programmés en langage R.
Le cinquième chapitre aborde l’analyse textuelle,
domaine assez largement exploré par Jean-Paul Benzécri
et ses collaborateurs au moyen de l’analyse des correspondances.
Cette dernière partie de l’ouvrage constitue une revue
synthétique de ces travaux. Elle se termine par la présentation
des études d’analyse textuelle appliquée à la
catégorisation des réponses aux questions ouvertes
dans les enquêtes de comportement sociaux. L’ouvrage
se refère aux travaux de Ludovic Lebart et André Salem,
deux des principaux contributeurs dans ce domaine. L’auteur
propose également un certain nombre de textes et d’outils
de traitement de textes spécifiques qui seront sans doute
très utiles aux lecteurs souhaitant s’initier à ce
type d’analyses.
Le mérite de Fionn Murtagh est d’avoir su mettre à la
disposition du lecteur anglophone tout un pan de la riche tradition
d’analyse multivariée de l’école française,
y compris dans ses aspects applicatifs, de façon très
accessible. Les nouveaux supports de programmation utilisés
favorisent un usage et un développement public de ces outils.
En outre, ils ouvrent de larges perspectives d’innovation
dans le domaine de l’interactivité qui se révèle
souvent être une fonctionnalité critique dans l’analyse
exploratoire de données complexes. Voici donc, en l’espèce,
un bien bel hommage rendu par l’élève au maître
!
|