Algorithm(iqu)e de Compression de dynamique d'image

Sujet de stage de DEA (potentiellement sujet de thèse) proposé par Thierry BERNARD

Mots-clés : traitement du signal et des images, non-linéaire, multi-échelles, multirésolution, infographie, transformation d'histogramme, EDP, morphologie mathématique

Un automobiliste circulant de nuit est confronté à des scènes qui peuvent comporter simultanément des zones très obscures et les phares aveuglants d'une voiture arrivant en sens inverse. Il en résulte potentiellement une très grande dynamique lumineuse : de l'ordre du million (c'est-à-dire 20 bits). Face à une telle dynamique, le conducteur s'en sort plus ou moins bien grâce à l'adaptivité de son système visuel et éventuellement en se protégeant de l'aveuglement. Mais supposons par exemple que l'on veuille restituer à distance la scène vue de la voiture de manière à "voir quelque chose" dans les zones les plus brillantes comme dans les zones les plus sombres. La paire d'images ci-dessous illustre cette problématique dans le cas d'une scène d'intérieur. A gauche se trouve l'image fournie par un appareil photo, dont la dynamique élevée rend trop sombre une grande partie de la scène. A droite figure une image "retravaillée", où il est possible de voir correctement l'ensemble de la scène.

Techniquement, une double question est posée. D'abord (a) existe-t-il des caméras capables d'acquérir des images de très grande dynamique ? Ensuite, à supposer que ce soit le cas, (b) quel principe employer pour afficher une telle image sur un moniteur dont la dynamique tonale n'est que de 8 bits (écran cathodique typique) voire moins (écran LCD) ?
On suppose ici que la question (a) est résolue et l'on se concentre sur la question (b) qui est purement algorithmique.  Pour solutionner (b), il faut pouvoir "tasser" une image de grande dynamique sans faire disparaître ses structures les moins contrastées. Une égalisation d'histogramme peut suffire dans certains cas, mais elle présente généralement des effets très pervers qui la rendent indésirable. L'égalisation d'histogramme est une méthode contrainte par la conservation de l'ordre tonal des pixels (un pixel plus sombre qu'un autre conserve cette propriété). Mais la conservation de l'ordre tonal n'est pas indispensable pour préserver le contenu informatif d'une image. En se débarassant de cette contrainte, il est possible bien plus facilement d'écraser les forts contrastes sans faire disparaître les faibles. Cela est illustré schématiquement sur la figure ci-dessous, qui montre un signal plutôt qu'une image. Le signal de droite est une version écrasée du signal de gauche, mais avec des détails de même amplitude, donc de dynamique plus faible. Cependant les deux signaux sont semblables par leur structure et seraient donc perçus de manière très similaire en tant que signaux image (l'ordonnée représente le niveau de gris).

Ecraser les forts gradients est possible dans le cadre d'une approche linéaire : il suffit pour cela d'amoindrir les composantes basse fréquence dans le signal par un filtrage adéquat. Mais à ce jeu, les portions constantes du signal qui sont proches d'une discontinuité sont transformées en des portions présentant un gradient : on parle d'un effet de "halo", tout à fait gênant. Pour échapper à cet effet, une approche non-linéaire, baptisée LCIS, a été récemment proposée. Remarquable d'un point de vue conceptuel, elle est en revanche très côuteuse en temps de calcul, notamment car elle repose sur une modélisation par EDP. Il nous semble possible d'effectuer des transformations ayant les mêmes vertus mais basées sur des opérateurs bien moins coûteux. L'objectif de l'étudiant sera d'explorer ces possibilités sur la base de ses compétences en traitement du signal et des images, notamment multi-échelles.
Le rendu de scènes de conduite nocturnes n'est qu'un exemple. D'autres applications nous motivent pour ce sujet de recherche qui n'en revêt pas moins un caractère fondamental : quelle dynamique mérite une image pour que son contenu informatif soit préservé ? Les caricaturistes jouent sur notre familiarité avec le visage des hommes politiques pour les réduire à quelques traits. Jusqu'à quel point peut on déformer - pour les tasser ! - des images moins courantes sans en perdre le sens ?


Auteur : T. Bernard
Dernière mise à jour : 3 avril 2003