L'apprentissage inductif vise à transformer des données brutes en modèles

Apprentissage inductif appliqué
et
Introduction à l'apprentissage statistique


Pierre Geurts et Louis Wehenkel
Université de Liège, Institut Montefiore


ELEN062-0 et ELEN0442-1: 1MBIM, 2MINFO (et à option dans diverses orientations)


Premier cours: lundi 19 septembre 2011, 14heures (première leçon et inscription au cours)
Lieu : Institut Montefiore (local II.93, voir aussi valves électroniques dans le hall d'entrée)


Nouveau: Liste de questions pour l'examen oral de janvier 2010 (ajouté le 22 décembre 2009)

Nouveau: Enoncés des travaux 2009-2010 de recherche par groupes (ajouté le 20 novembre 2009)

Enoncé travail PEPITo (ajouté le 20 octobre 2008)

Transparents (2010-2011):
Page web du livre de référence

Vous trouverez ci-dessous les versions pdf des transparents utilisés pour le cours oral

Leçon 1: Introduction au cours (LW)

Leçon 1: Exemples d'applications (LW)

Leçon 1 et 2: Introduction à l'apprentissage automatique (PG)

Leçon 3: arbres de décision et de régression: principes généraux (LW).

Leçon 3: arbres de décision et de régression: scores, mesures de qualité, etc. (LW)

Leçon 3: arbres de décision et de régression : compléments sur l'élagage (LW)

Leçon 4: régression linéaire (mis à jour 2006-2007) (LW)

Leçon 4: méthode du plus proche voisin (LW)

Leçon 5: reseaux de neurones (LW)

Leçon 6: Bias/variance tradeoff, model assessment and selection (PG)

Leçon 7: Machines à support vectoriel et méthodes à base de noyaux (PG)

Leçon 8: Méthodes d'ensemble et sélection de variables (PG)

Leçon 9: Apprentissage non supervisé (PG)

Leçon 9 bis: PCA Apprentissage non supervisé (PG)



(en date du 2/1/2006)
- Questions de l'examen oral 2005-2006: (pdf)

Transparents supplémentaires (2004-2005) :
Arbres de décision et de régression (P. Geurts, 2003)

Biais/Variance + Méthodes d'ensemble (P. Geurts, 2003)

Classification d'images (P. Geurts, 2003)
Descriptif :
Le cours s'adresse aux ingénieurs électriciens, physiciens et électromécaniciens, toutes orientations confondues, ainsi qu'aux étudiants de troisième cycle (doctorants) et aux licenciés en informatique et en sciences mathématiques.
L'apprentissage désigne l'induction automatique d'une solution générale d'un problème à partir de solutions particulières. Les applications en sont nombreuses: extraction de règles de diagnostic médical de relevés médicaux de patients; construction de procédures d'allocation de crédits bancaires à partir de bases de données de clients; extraction de critères de sécurité de réseaux électriques à partir de simulations numériques; modélisation simplifiée de processus complexes; synthèse automatique de programmes; extraction d'expertise humaine...
La partie théorique du cours introduit les différents types de problèmes d'apprentissage (exploration de données, classification automatique, approximation) et les grandes classes de méthodes complémentaires (statistiques, symboliques, neuronales). Les travaux pratiques permettent aux étudiants de se familiariser avec ces dernières en les appliquant à diverses bases de données réelles.
Horaire :
Lundi PM (14-18h), premier semestre. Local I18 - Institut Montefiore
Modalités :
QCM sur la théorie en décembre.
Travail pratique au premier semestre.
Examen oral en janvier ou en juin.
(Liste de questions)

Notes :
Vous trouverez ci-dessous les versions .pdf et .ps des notes du cours (gzippés)

Version .pdf avec liens hypertexte (2065813 bytes)

Version .ps imprimable (1019993 bytes)
Transparents (2007-2008):
Vous trouverez ci-dessous les versions pdf des transparents utilisés pour le cours oral

Leçon 1: Réseaux Bayésiens .

Leçon 1: partie 1 69kbytes.

Leçon 1: partie 2 2,5Mbytes.

Leçon 2: arbres de décision et de régression (mis à jour 2006-2007) 397kbytes.

Leçon 2: arbres de décision et de régression (mis à jour 2006-2007: scores, mesures de qualité, etc.) 133kbytes.

Leçon 3: régression linéaire (mis à jour 2006-2007) 163kbytes.

Leçon 4: méthode du plus proche voisin 159kbytes.

Leçon 6: theorie de l'apprentissage 259kbytes.

Leçon 7: modeles a base de noyaux 299kbytes.

Leçon 7: articles a lire 259kbytes.

Leçon 8: Méthodes d'ensemble (1) 1,1Mytes.

Leçon 9: Méthodes d'ensemble (2) 93kbytes.

Leçons 8 et 9: articles a lire 1,3Mbytes.

Leçon 10: Apprentissage par renforcement (slides et article à lire) 1,5 Mbytes.

Programmation dynamique: slides de R. Sutton. (cours oral 2006-07) 1,1 Mbytes.

Slides séminaire de Rémi Munos (2006-07) 800 kbytes.

Leçon 11 et 12: apprentissage non supervisé (1 et 2) 176kbytes.

Leçon 12: aprentissage RB (1) 184kbytes.

Leçon 12: apprentissage RB (2) 10Mbytes.

Travaux pratiques sur ordinateur :

Note: Les travaux pratiques se font à l'aide du logiciel PEPITo (version 1.5). Le logiciel est installé sur le réseau étudiant de Montefiore. Contactez Samuel Hiard pour obtenir les instructions d'utilisation de ce logiciel, ou une copie pour votre PC (et les conditions de son utilisation).

Lien vers la page de PEPITe S.A.


Voici un lien vers la version de la BD OMIB à utiliser pour les travaux pratiques omib.zip En cas de problèmes, signalez les moi par email.


Retour
Back Louis Wehenkel' home page Back to Stochastic Methods home page Back to Institut Montefiore home page Back to the ULg home page
Last update: 12 septembre 2008