Filtrage collaboratif

L'idée des systèmes de filtrage collaboratif (appelé aussi systèmes de recommandation) est de prédire si un utilisateur (par exemple un client potentiel sur un site de vente en ligne) appréciera ou non un nouvel objet (par exemple, un film ou une chanson) à partir uniquement des appréciations rentrées par cet utilisateur pour d'autres objets. Ces systèmes sont beaucoup utilisés sur les sites de commerce par internet pour proposer à l'utilisateur des achats liés, mais ils trouvent aussi des applications dans beaucoup d'autres domaines telles que la bioinformatique. Les méthodes de filtrage collaboratif se basent la plupart du temps sur des techniques d'apprentissage automatique.

En fonction des goûts de l'étudiant, le but de ce travail de fin d'étude sera de faire une étude systématique et théorique des algorithmes qui ont été proposés dans ce domaine et/ou de réaliser une implémentation de certains de ses algorithmes et de les évaluer sur la base de données netflix (voir plus bas) ou sur un problème de bioinformatique qui sera fourni à l'étudiant.

Références:

* Empirical analysis of predictive algorithms for collaborative filtering http://research.microsoft.com/apps/pubs/default.aspx?id=69656

* Jun Wang's Collaborative Filtering Resources http://web4.cs.ucl.ac.uk/staff/jun.wang/blog/2009/06/17/collaborative-filtering-resources/

* http://www.netflixprize.com La société netflix, spécialisée dans la location de films par internet, a lancé en 2006 une compétition internationale visant à mettre au point un algorithme de recommandation qui améliorerait la précision de leur propre algorithme (appelé cinematch) de plus de 10%. A la condition qu'elle rende son algorithme public, l'équipe gagnante recevrait la somme d'un million de dollars. Pour callibrer les algorithmes, la société netflix met à disposition des utilisateurs une base de données de plus de 100 millions de score d'évaluation (obtenus de 480000 utilisateurs sur 18000 films). Au moment de la rédaction de ce sujet, il semble qu'une équipe ait atteint la barre des 10% et devrait donc remporter le prix

Renseignements: