Détection et analyse du mouvement sur système de vision à base de rétine numérique

 
 
Domaines : 
  • Vision par ordinateur
  • Rétines numériques
  • Algorithmique
  • Perception du mouvement
Sous-domaines :
  • Détection de mouvement
  • Flot optique
  • Codage et compression
  • Vision active

La rétine numérique est un circuit qui combine fonctions d'acquisition et de traitement des images. C'est une grille bidimensionnelle de "cellules", chaque cellule étant formée de l'association d'un élément photosensible (photorécepteur), et d'un élément de calcul (processeur). Du point de vue algorithmique, la rétine numérique est une machine massivement parallèle de type réseau d'automates cellulaires, caractérisée par des éléments de calcul de capacité très limitée. Dans un système de vision, la rétine est associée à un hôte appelé cortex, typiquement composé d'un processeur scalaire (microprocesseur basse puissance ou DSP) et d'un circuit de logique programmable (FPGA). Le cortex a deux fonctions : (1) Contrôler la rétine, en lui envoyant les séquences de commandes. (2) Effectuer les tâches de haut niveau du problème de vision, à partir des informations extraites de la rétine. Un système de vision à base de rétine doit permettre d'atteindre de grandes performances en terme de vitesse, grâce au parallélisme massif de la rétine, et aussi en terme de consommation d'énergie, de par la réduction drastique du flux d'information au sein du système : l'entrée est optique, et les traitements rétiniens permettent d'agréger les données images en une information "pré-symbolique", peu coûteuse à extraire, et à laquelle le cortex va donner une structure, une signification, par des calculs de faible volume.

De par ces avantages, le couple (rétine, cortex) est particulièrement adapté aux systèmes de visions portables, mobiles, autonomes. Cela implique que la perception du mouvement doit être une caractéristique forte du système à base de rétine. Les applications sont nombreuses et variées : systèmes de télésurveillance, capteurs de robots mobiles, systèmes de poursuite automatique, caméras compressives...

Si les rétines sont adaptées à ces applications, la petite capacité des éléments de calcul, et en particulier leur faible mémoire constitue une réelle difficulté pour la perception du mouvement. Mais cette difficulté donne à cette thèse son caractère fondamental : les solutions apportées aux différents problèmes d'analyse du mouvement apporteront une innovation radicale, parce que dans un système à base de rétine, l'algorithmique "commence" dès l'acquisition et se poursuit jusque dans la manière de coder une donnée, et de l'extraire. Ainsi, dans le cadre de cette thèse, l'étudiant qui abordera un problème d'analyse du mouvement devra appréhender "toute la hauteur" de la chaîne algorithmique, de l'acquisition à la compréhension : Comment coder l'information image dans le circuit, en ne conservant que les caractéristiques pertinentes du point de vue de l'application ? Comment à partir de ces données, calculer l'information de mouvement de manière massivement parallèle dans l'image ? Quels données pré-symboliques extraires, et comment ? Comment les exploiter ? Quel dialogue entre la rétine et son cortex ?

Telles sont les questions qui forment la substance de ce travail de thèse. L'étudiant abordera dans ce travail l'implantation de différents problèmes liés au mouvement : détection, calcul du flot optique, poursuite de cibles, dont il dégagera des enseignements et des propriétés émergentes. Puis, il s'efforcera de mettre en oeuvre une démarche globale, forcément originale, de perception du mouvement sur système à base de rétine.