next up previous contents
Next: État de l'art Up: No Title Previous: Introduction

Sous-sections
Analyse du problème

Cette section est consacrée à établir une classification des problèmes rencontrés lors de l'élaboration d'un système de traitement de séquence d'images, afin d'en faciliter la conception. Cette classification se décompose en trois types de difficultés. La première regroupe les problèmes d'occultations; la seconde vise à classifier les problèmes de suivi multipistes des objets dans l'image; la dernière est consacrée aux problèmes d'incertitudes.

Les problèmes d'occultations

L'utilisation d'images issues de caméra monoculaire est à l'origine de nombreux problèmes. Contrairement au cadre de la vision stéréoscopique, notre champ d'études utilise des informations d'entrée en deux dimensions : les images. Or la réalité de la scène est en 3D (voire 3D+t). une quantité d'information non négligeable est donc perdue lors de la projection dans le plan focal de la caméra. Cette projection est à l'origine de nombreux problèmes d'occultations. On choisira, pour catégoriser ces problèmes, les deux axes suivants : un axes qualitatif et un axe quantitatif.

L'aspect qualitatif

Selon l'axe qualitatif, les problèmes d'occultations nous amènent à se demander si un objet est occulté de façon statique ou dynamique. Ceci revient à se demander si un objet, dont on qualifie l'occultation, l'est par un objet immobile de la scène (ex. du mobilier) ou par un autre objet mobile. Les réponses à apporter, algorithmiquement parlant, ne sont en effet pas du tout les mêmes (cf.figures 4 et 5).


  
Figure: Problème d'occultation statique partielle
\includegraphics[width=12cm]{images/img_occult_stat.eps}


  
Figure: Problème d'occultation dynamique partielle
\includegraphics[width=12cm]{images/img_occult_dynm.eps}

L'aspect quantitatif

Selon l'axe quantitatif, les problèmes d'occultation se posent en termes de quantité de surface occultée. On distingue alors deux cas: l'occultation partielle laissant une partie de l'objet considéré visible et l'occultation totale, l'objet ayant dans ce cas totalement disparu de l'image. La encore, les recours algorithmiques ne sont pas du tout de la même nature (cf.figures 4 et 5).

Les problèmes dynamiques

La dernière catégorie de difficultés est l'ensemble des problèmes liés au suivi. Le terme de piste est utilisé pour qualifier une suite continue de positions d'un objet au cours du temps. On note l'existence de deux couples de comportements problématiques de ces pistes : l'initialisation et la terminaison ainsi que le mélange et l'éclatement.

L'initialisation de piste

L'initialisation de piste est définie par le premier élément d'une suite de caractéristiques représentant un objet.(voir figure 6) En fait, le problème de légitimité de cette initialisation intervient très souvent dans le sens où il n'existe pas forcément d'adéquation entre l'arrivée d'un objet dans la scène et le commencement d'une piste. Un objet peut apparaître sans qu'une piste soit automatiquement ouverte. De même, une piste peut être ouverte sans qu'un nouvel objet soit apparu, dans le cas d'une piste correspondant à un objet précédemment occulté, par exemple.


  
Figure: Les problèmes dynamiques
\includegraphics[width=10cm]{images/img_pbs_tracking.eps}

La terminaison de piste

Le problème dual de celui posé par l'initialisation de piste est celui de la terminaison de piste. Une terminaison de piste est définie par l'existence d'un dernier élément de la suite de positions. On constate que ce dernier élément est associé à la disparition d'un objet de la scène, mais la disparition d'un objet de l'ensemble des détections ne signifie pas forcément sa disparition réelle. La encore, ce phénomène peut être un problème d'occultation par exemple. De façon générale, les problèmes d'initialisation et de terminaison de pistes posent le problème des entrées-sorties d'objet dans la scène.

La fusion de pistes

Le problème de fusion de pistes se pose de façon différente des deux problèmes précédents. Une fusion de pistes fait intervenir au moins deux pistes et est qualifiée si il existe une filiation père-fils de deux objets fils de l'image It-1 distincts vers un unique objet père de l'image It. Un problème de légitimité se pose encore car certains cas de mélange peuvent avoir un sens et une légitimité, alors que d'autres ne peuvent être qualifiés que d'accident dans les traitements. (voir figure 6) Dans le cas d'un groupe de personnes qui se rejoint en un point de la scène, on peut considérer comme légitime que les pistes définies par les trajectoires de chacune des personnes se mélangent. En revanche, dans le cas d'occultation dynamique (occultation d'un objet mobile par un autre objet mobile) la légitimité du mélange des pistes se pose plus difficilement.

L'éclatement de pistes

Le problème dual du mélange est le problème d'éclatement de piste. On définit un éclatement par une filiation père-fils d'un unique objet père de l'image It-1 vers deux objets fils distincts de l'image It. Là encore, certains de ces cas paraissent avoir du sens tel que la séparation d'un groupe de personnes (voir figure 6), dont on aurait suivi une unique piste (à cause de la proximité des personnes dans le groupe). D'autres cas, en revanche, relèvent de l'accident de traitement (un objet réel de la scène bien détecté jusqu'à l'instant t, dont la détection à un instant t+1 donne plusieurs objets).

Les problèmes d'incertitude

Une catégorie de problèmes du domaine est la gestion de l'incertitude à toutes les étapes des traitements. En fait, il existe différents niveaux d'incertitude que le système doit savoir gérer. Le plus fin est le bruit inhérent aux images numérisées. Les effets naturels dans la scène correspondent à un second niveau d'incertitude et le grain le plus épais d'imprécision est lié aux objets eux-mêmes.

L'hypothèse du bruit gaussien

Un problème récurrent du traitement d'images est le problème du bruit introduit par la numérisation préalable des images. Une numérisation de basse résolution introduit une faible qualité d'image qui pose problème lors des étapes de détection et de reconnaissance. Or une numérisation de haute résolution pose des problèmes de manipulation d'information, car il s'agit alors de gérer d'importants volumes de données, ce qui est problématique dans l'élaboration de systèmes embarqués ou de système temps réel, par exemple. Par conséquent nous sommes contraint à utilisé des images de basse résolution. L'hypothèse, la plus communément envisagée est celle d'un bruit gaussien appliqué à chaque pixel de l'image. Dans [2], l'utilisation d'un modèle de ce type durant l'étape de détection permet d'estimer le bruit et ainsi de fiabiliser les résultats. Dans [8], les auteurs font mention d'un modèle de bruit aléatoire combiné au modèle d'objet qu'ils utilisent. Leur modèle d'objet est défini par un polyèdre 3D, dont chacune des arêtes est soumise à une <<contamination aléatoire du bruit>>, définie par deux degrés de liberté supplémentaires. Il en résulte une intéressante flexibilité du modèle d'objet.

Les phénomènes naturels

L'utilisation d'images réelles pose, en soi, un problème. En effet, de nombreux algorithmes de traitement d'image élaborés en laboratoire se révèlent inadéquats dans le cadre d'images réelles (cf.figure 7). Les phénomènes naturels tel que les ombres d'objets, les réflexions d'objets sur le sol et autres surfaces propices, l'obscurité et les changements d'illumination sont des problèmes majeurs du traitement de séquences d'images naturelles. [11] propose, pour faire face aux problèmes d'ombrage, un modèle d'illumination basé sur l'existence d'une source lumineuse à l'infini immobile au cours du temps (durant la séquence). Une ombre théorique de l'objet est alors calculée et prise en compte lors de l'instanciation du modèle d'objet. Cette méthode est très intéressante mais ses hypothèses sont très strictes : elles conviennent, en effet, à des scènes extérieures (source lumineuse à l'infini) et de courte durée(source lumineuse immobile au cours du temps). Dans [21], les auteurs proposent une solution possible aux problèmes de changement d'illumination de la scène par une méthode d'intégration de l'image de référence utilisée.


  
Figure: Illustration des problèmes d'incertitudes
\includegraphics[width=12cm]{images/img_incert.eps}

Les incertitudes objet

Les objets mobiles peuvent parfois apparaître comme indésirables. Les objets mobiles naturels tels que les objets mus par le vent (ex: feuillage des arbres) et la pluie doivent être pris en compte. Les artefacts mobiles sont aussi problématiques. Que leur existence corresponde à un phénomène périodique, comme un escalator ou comme un métro (avec une périodicité différente) ou qu'ils révèlent un phénomène chaotique (apparition d'un véhicule et tout autre accident dans l'image), les artefacts mobiles sont un problème sur lequel la littérature est assez discrète.

Bilan et conclusions

Nous venons de voir, dans cette section la majorité des problèmes que pose l'élaboration d'un système de traitement de séquence d'images pour l'interprétation de scène. Bien que de nature, tout à fait différents, les trois axes, que sont les problèmes d'occultations, les problèmes de suivis multipistes et sont les problèmes d'incertitudes doivent rester au premier plan des préoccupations du concepteur de tels systèmes. Le problème se pose alors de trouver une architecture générale permettant de savoir, à quels étapes de la séquence des traitements, quel problème peut être résolu. Pour concevoir cette architecture, nous allons voir dans la suite quelques éléments de réponses.


next up previous contents
Next: État de l'art Up: No Title Previous: Introduction
Nathanael Rota
2000-11-06