Apprentissage automatique pour le traitement automatique des langages naturels

“Le Traitement automatique du langage naturel (TAL) est une discipline à la frontière de la linguistique, de l'informatique et de l'intelligence artificielle, qui concerne l'application de programmes et techniques informatiques à tous les aspects du langage humain” (définition wikipédia). Parmi les applications les plus courantes du TAL, on retrouve la traduction automatique, la correction orthographique, la génération automatique de résumés de textes, la classification et la catégorisation de documents. Le TAL repose de plus en plus sur l'utilisation de techniques statistiques issues de l'apprentissage automatique et du data mining.

L'objectif de ce TFE, très ouvert, est d'explorer les applications de l'apprentissage automatique dans le domaine du TAL. Le travail pourra être de différentes natures en fonction des goûts de l'étudiant: synthèse de la littérature dans le domaine (ou un de ces sous-domaines applicatifs), implémentation d'un système pour résoudre un problème concret, développement d'une nouvelle méthode, etc.

Bibliographie

Renseignements

Encadrement: Pierre Geurts