Détection et reconnaissance de signaux routiers dans un flux vidéo

Résumé

Ce projet est un travail de fin d'études qui a été présenté à l'Université de Liège le 27 juin 2006 en vue d'obtenir le grade d'Ingénieur Civil électricien. Il a été réalisé par Jean-François Verdin et moi-même.

L'objectif de ce travail était la réalisation d'un outil de détection, de localisation et de reconnaissance de signaux routiers par acquisition vidéo, en vue de construire une base de données de signaux routiers géoréférencés à l'aide d'un système GPS.

Nous avons d'abord réalisé une étude bibliographique. Nous y avons décrit les méthodes les plus couramment utilisées et celles dont nous nous sommes inspirés pour ce travail.

La détection et la localisation sont accomplies grâce à une cascade de classeurs entraînés sur des filtres de Haar, avec une variante de l'algorithme AdaBoost. Le taux de détection obtenu sur des images isolées est supérieur à 90 % pour environ 1 fausse alarme toutes les 5 images. L'entraînement de la cascade de classeurs a nécessité la création d'une base de données contenant 1988 images de signaux routiers.

Les signaux détectés et localisés sont suivis à l'aide de filtres de Kalman. Un suivi multicible est géré par un algorithme d'association de données qui permet par la même occasion d'éliminer un nombre important de fausses alarmes.

Le programme de détection, implémenté en C sous Linux, est destiné à fonctionner en temps réel. Actuellement non optimisé, il fonctionne à une vitesse de 9 images (640×480) par seconde sur une machine équipée d'un processeur Intel Pentium IV 2.8 GHz. Le système a été testé avec succès sur des séquences vidéo obtenues en environnement urbain et suburbain, dans des conditions météorologiques variables, à des vitesses atteignant 70 km/h.

La reconnaissance des signaux est effectuée entièrement off-line. Nous avons testé plusieurs techniques sur des images provenant de 5 classes. La première utilise un modèle génératif dans un espace réduit par une analyse en composantes principales suivie par une analyse discriminante linéaire. La seconde est celle du plus proche voisin dans ce même espace. La troisième méthode est basée sur une extraction aléatoire de fenêtres et sur des ensembles d'Extra-Trees. La méthode est implémentée dans le logiciel PiXiT de la société PEPITe. Nous atteignons pour toutes les méthodes des taux de reconnaissance supérieurs à 90 %.

Suite à ce travail exploratoire, de nombreuses perspectives sont envisageables, la plus importante étant l'apport d'un système GPS qui permettrait de générer une base de données de signaux routiers géoréférencés.

Captures vidéo du détecteur

[Séquence vidéo détaillée]
Séquence vidéo détaillée
Les fenêtres rouges sont les régions détectées par le détecteur de Viola et Jones (basé sur les ondelettes de Haar). Les fenêtres vertes sont les fenêtres détectées comprenant une proportion suffisante de rouge. Les fenêtres deviennent jaunes lorsque la piste est validée. L'étiquette apparaissant au-dessus d'une fenêtre indique l'identité de la piste, son âge (en nombre d'images) et enfin le nombre d'images successives pour lesquelles la piste n'a pas été associée à une observation. (Version longue.)
[Séquence vidéo finale]
Séquence vidéo finale
Séquence identique à la précédente, mais seules les pistes validées sont affichées. (Version longue.)

Documents

[Icône PDF] Détection et reconnaissance de signaux routiers dans un flux vidéo. [Entrée BibTeX]

[Icône PDF] Slides.

[Icône archive] Les sources C de l'application de detection des signaux.
Toutes les sources avec des images et videos.