|
Le data
mining est aujourd’hui de plus en plus utilisé dans certaines entreprises
très compétitives. Ce développement, rendu possible par la disponibilité
grandissante de masses de données importantes, pose des contraintes tant
théoriques (quels algorithmes utiliser pour produire des modèles d’analyses
exploitant des milliers de variables pour des millions d’exemples)
qu’opérationnelles (comment mettre en production et contrôler le bon
fonctionnement de centaines de modèles). Je
présenterai ces contraintes issues des besoins d’entreprises dans différents
domaines ; je montrerai comment exploiter des résultats théoriques (provenant
des travaux de Vladimir Vapnik) pour produire des outils robustes ; je
donnerai des exemples d’applications réelles en gestion de la relation
client, en score crédit et en analyse de qualité. Nous verrons ainsi comment
il est possible d’industrialiser le data mining et en faire un élément
totalement intégré partout où on dispose de données. |