Le Monde des Utilisateurs de L'Analyse de Données

Agenda

 
 

Les actualités du traitement des données
L'actualité des méthodes et des outils pour l'exploitation de l'information


Agenda des manifestations

 

OCTOBRE 2008

International workshop on Data Stream Management and Mining
Location: Beijing, China.
Dates : Oct. 30-31, 2008.


JANVIER 2009

9èmes Journées Francophones "Extraction et Gestion des Connaissances", Strasbourg-France, 27 au 30 Janvier.

https://lsiit.u-strasbg.fr/egc09/index.php/Accueil

Dans le prolongement des huit éditions précédentes, EGC 2009 ambitionne de regrouper chercheurs, industriels et utilisateurs francophones issus des communautés Bases de Données, Apprentissage, Représentation des Connaissances, Gestion de Connaissances, Statistique et Fouille de données. Aujourd'hui, de grandes masses de données structurées ou semi-structurées sont accessibles dans les bases de données d'entreprises ainsi que sur la toile. Aussi les entreprises ont-elles besoin de méthodes et d'outils capables de les acquérir, de les stocker, de les représenter, de les indexer, de les intégrer, de les classifier, d'extraire les connaissances pertinentes pour les décideurs et de les visualiser. Pour répondre à cette attente, de nombreux projets de recherche se développent autour de l'extraction de connaissances à partir de données (Knowledge Discovery in Data), ainsi que sur la gestion de connaissances (Knowledge Management).

L'objectif de ces journées est de rassembler, d'une part les chercheurs des disciplines connexes (apprentissage, statistique et analyse de données, systèmes d'information et bases de données, ingénierie des connaissances, etc.), et d'autre part les spécialistes d'entreprises qui déploient des méthodes d'extraction et de gestion des connaissances, afin de contribuer à la formation d'une communauté scientifique dans le monde francophone autour de cette double thématique de l'extraction et de la gestion de connaissances.


MARS 2009

http://www.ifcs2009.de/

IFCS 2009 - International Federation of Classification Societies 2009, Dresden- Allemagne, March 13-18.

The 11th Biennial Conference of the International Federation of Classification Societies (IFCS) will take place at the University of Technology of Dresden, Germany, March 13-18, 2009, in combination with the 33rd annual conference of the German Classification Society - Gesellschaft für Klassifikation (GfKl).

The conference will focus on classification and data analysis as tools for research in various applications. The scientific program will include sessions with invited talks and contributed presentations from a broad range of topics. Special emphasis will be laid on interdisciplinary research and the interaction between theory and practice. Researchers and practitioners are kindly invited to submit papers for presentation.



SEPTEMBRE 2009

http://www.pls09.org/

PLS 2009 - Partial Least Squares 2009, Beijing- Chine, September 4-7.

The 6th International Conference on Partial Least Squares and Related Methods (PLS'09) will take place in Beijing (China) on September 4th -7th, 2009. PLS'09 focuses on research in Management, Engineering and Life Sciences.This conference is a unique event through which outstanding experts in PLS methods, from all over the world, can meet and communicate.
During the four day meeting, experts from different countries and regions will present their state-of-art and up-to-date research on the PLS methods, which will reflect challenging advances in this fields for the 21st century. The PLS techniques will be compared with other typical methods and empirical applications to real data will be performed. The Symposium will provide participants with different insights on both theoretical and practical aspects of PLS and related methods. Furthermore, the symposium will be also precious chance and platform for academic scholars and specialized professionals to meet and talk on their own interests in versatile fields where PLS can be applied to.


AUGUST 2010 :

COMPSTAT 2010 - International Conference on Computational Statistics August 23-27.

The 19th Symposium of the European Regional Section of the IASC, COMPSTAT 2010, to be held in the premises of Conservatoire National des Arts et Métiers (CNAM) in Paris.
Besides the main Conference, a satellite meeting or a tutorial will be organized at INRIA Rocquencourt Research Unit, a campus near Versailles at a few kilometres from Paris.
Information: Gilbert Saporta
E-mail: info@compstat2010.fr


Cycle de conférence "Jean-Pierre Fénelon" sur l'analyse multidimensionnelle des données statistiques

Télécharger le programme ici.


Autres : manuels lus (Dominique DESBOIS)

Ré-édition : Statistique théorique et appliquée de Pierre Dagnelie
tome 2 (exercices en R disponibles).

A tous les lecteurs de la revue de Modulad, en particulier à ceux qui suivent avec attention les travaux de Pierre Dagnelie, signalons les éléments suivants : le tome 2 de "Statistique théorique et appliquée" vient de faire l'objet d'une réédition (734 pages, ISBN 2-8041-5229-4), brièvement présentée àl'adresse <www.dagnelie.be/stpres.html>; cette nouvelle édition du tome 2 présente, par rapport à l'édition de 1998, un nombre important de modifications, y compris une mise à jour complète de la documentation bibliographique. Une idée précise du contenu de ce livre peut être obtenue en téléchargeant, en format PDF, la table des matières, l'index des matières et/ou les introductions des différents chapitres aux URL suivantes
< www.dagnelie.be/docpdf/st2table.pdf>,
< www.dagnelie.be/docpdf/st2index.pdf> et
< www.dagnelie.be/docpdf/st2chap.pdf>.

- les solutions d'un certain nombre d'exercices de ce livre, préparées à
l'aide du logiciel R par Emmanuel Nowak, sont disponibles à l'adresse
< www.dagnelie.be/stlogr.html>;

- le texte intégral du livre "Principes d'expérimentation: planification des expériences et analyse de leurs résultats", et les solutions R de ses exercices, sont toujours disponibles aux adresses
< www.dagnelie.be/expres.html> et <www.dagnelie.be/exlogr.html>.

Rappelons que les deux tomes de "Statistique théorique et appliquée" ont remplacé en 1998 les volumes du traité "Théorie et méthodes statistiques", très largement diffusés à partir de 1969-1970. Une nouvelle édition du tome 1 doit paraître prochainement. "Statistique théorique et appliquée" est publié par les éditions De Boeck et diffusé par sa société associée Accès+, cf. <www.deboeck.com>, respectivement <acces+cde@deboeck.be>.

"Introduction aux Plans d'expériences" de Jacques Goupy et Lee Creighton.

<http://www.dunod.com/pages/ouvrages/ficheouvrage.asp?id=49744>.
Si l'ancienne version de cet ouvrage ne traitait que des plans factoriels complets et fractionnaires, cette édition s’enrichit de nouvelles extensions (plans pour surfaces de réponses, plans de mélanges, plans D-optimaux, plans pour variables discrètes) avec pour ambition de présenter les applications actuelles des plans d'expériences.
Ce livre est accompagné d'un logiciel permettant de réaliser pendant une période d’essai (6 mois) les calculs de ses propres plans en vue d’applications. Le manuel d'utilisation du logiciel et les exemples du livre sont téléchargeables sur : < http://www.plansdexperiences.com/>.

Correspondence Analysis and Data Coding with Java and R
Fionn Murtagh

Avant-propos de Jean-Paul Benzécri
Chapman & Hall / CRC, 230 p., 2005.

L’ouvrage de Fionn Murtagh constitue une introduction de langue anglaise très complète à la mise en œuvre de l’analyse des correspondances à partir d’outils récents. Elle n’est certes pas la première mais son originalité est d’exposer cette méthodologie à partir d’exemples basés sur l’utilisation du langage Java et, de façon plus essentielle, du logiciel libre R.
Parmi les autres originalités de cet ouvrage, il faut citer un avant-propos de Jean-Paul Benzécri, fait d’autant plus rare qu’il mérite d’être signalé, où celui-ci revient sur son parcours de statisticien géomètre. Ce texte présenté à la fois en anglais et en français permettra ainsi à un plus grand nombre d’apprécier pleinement la saveur de cette rétrospective dont l’objet est en réalité de se saisir des questions du futur…
Pour revenir au travail de Fionn Murtagh, le premier chapitre revisite depuis Galton et Quetelet les développements les plus remarquables ayant abouti aux outils dont les statisticiens disposent aujourd’hui. Cette introduction reprend à grands traits les linéaments de l’ouvrage intitulé « Histoire et préhistoire de l’Analyse des données » rendant ainsi accessible aux lecteurs non francophones la perpective tracée par Jean-Paul Benzécri dans ce champ. Les commentaires originaux de Fionn Murtagh guident le lecteur vers les développements consacrés à l’analyse des correspondances tout en les situant vis à vis des autres travaux, mobilisant sa connaissance intime de cette méthodologie ainsi qu’une culture statistique que l’on devine très étendue. Une présentation introductive de l’analyse en composantes principales et de l’analyse des correspondances, assortie des fonctions logicielles associées, conclut ce premier chapitre.
Le chapitre suivant est une présentation théorique de l’analyse des correspondances et de la classification hiérarchique, basée sur le système de notation tensorielle privilégié par Jean-Paul Benzécri dans ses exposés. Cette partie de l’ouvrage présente également les concepts de distance et d’inertie qui sont associés à ces développements ainsi que les grandes familles de méthode de la classification automatique.
Le troisième chapitre, dans la démarche méthodologique propre à l’Analyse des données, insiste sur l’importance théorique du codage et ses implications pratiques, présentant les différentes stratégies de recodage, du codage disjonctif complet à la théorie des possibilités en passant par les techniques du codage flou, du codage barycentrique et des fonctions splines.
Le quatrième chapitre est consacré à la présentation des diverses applications de l’analyse des correspondances qu’il s’agisse d’archéologie basée sur la morphométrie (gobelets thaï, craniométrie) ou d’économie (commerce international des phosphates) voire d’analyse financière. Chacune de ces études permet à l’auteur d’insister sur l’importance des fonctions d’aides à l’interprétation en analyse des données pour qualifier les axes ou bien les classes obtenus, fonctions présentées sur la base de modules spécifiques programmés en langage R.
Le cinquième chapitre aborde l’analyse textuelle, domaine assez largement exploré par Jean-Paul Benzécri et ses collaborateurs au moyen de l’analyse des correspondances. Cette dernière partie de l’ouvrage constitue une revue synthétique de ces travaux. Elle se termine par la présentation des études d’analyse textuelle appliquée à la catégorisation des réponses aux questions ouvertes dans les enquêtes de comportement sociaux. L’ouvrage se refère aux travaux de Ludovic Lebart et André Salem, deux des principaux contributeurs dans ce domaine. L’auteur propose également un certain nombre de textes et d’outils de traitement de textes spécifiques qui seront sans doute très utiles aux lecteurs souhaitant s’initier à ce type d’analyses.
Le mérite de Fionn Murtagh est d’avoir su mettre à la disposition du lecteur anglophone tout un pan de la riche tradition d’analyse multivariée de l’école française, y compris dans ses aspects applicatifs, de façon très accessible. Les nouveaux supports de programmation utilisés favorisent un usage et un développement public de ces outils. En outre, ils ouvrent de larges perspectives d’innovation dans le domaine de l’interactivité qui se révèle souvent être une fonctionnalité critique dans l’analyse exploratoire de données complexes. Voici donc, en l’espèce, un bien bel hommage rendu par l’élève au maître !