Modules de pré-traitement de données dans le cadre du Data Mining

Une étape cruciale du processus de découverte de connaissances à partir de grandes bases de données est le pré-traitement de données. En appliquant des algorithmes de data mining sur des données de qualité faible, on complexifie l’apprentissage et l’on nuit à la performance du modèle. Pour améliorer la qualité des données présentées aux algorithmes de data mining plusieurs étapes de pré-traitement doivent être effectuées successivement : le nettoyage, l’intégration, la transformation des enregistrements et des attributs, la réduction, la discrétisation. Différentes techniques et algorithmes de pré-traitement de données seront à implémenter en langage C sous la forme de modules.

Etudiant: Sandrine Curtet

Année: 2005

Département: TIC

Filière: Informatique et systèmes de communication (anciennement Informatique)

Type de formation: Plein temps

Partenaire externe: la HEIG-VD / IICT

Enseignant responsable: Laura Elena Raileanu

Téléchargement:
- Télécharger l'affiche