Next: État
de l'art Previous: Introduction
Sous-sections
Analyse du problème
Cette section est consacrée à établir une classification
des problèmes rencontrés lors de l'élaboration d'un
système de traitement de séquence d'images, afin d'en faciliter
la conception. Cette classification se décompose en trois types
de difficultés. La première regroupe les problèmes
d'occultations; la seconde vise à classifier les problèmes
de suivi multipistes des objets dans l'image; la dernière est consacrée
aux problèmes d'incertitudes.
Les problèmes
d'occultations
L'utilisation d'images issues de caméra monoculaire est à
l'origine de nombreux problèmes. Contrairement au cadre de la vision
stéréoscopique, notre champ d'études utilise des informations
d'entrée en deux dimensions : les images. Or la réalité
de la scène est en 3D (voire 3D+t). une quantité d'information
non négligeable est donc perdue lors de la projection dans le plan
focal de la caméra. Cette projection est à l'origine de nombreux
problèmes d'occultations. On choisira, pour catégoriser ces
problèmes, les deux axes suivants : un axes qualitatif et un axe
quantitatif.
L'aspect qualitatif
Selon l'axe qualitatif, les problèmes d'occultations nous amènent
à se demander si un objet est occulté de façon statique
ou dynamique. Ceci revient à se demander si un objet, dont on qualifie
l'occultation, l'est par un objet immobile de la scène (ex. du mobilier)
ou par un autre objet mobile. Les réponses à apporter, algorithmiquement
parlant, ne sont en effet pas du tout les mêmes (cf.figures
et
).
Figure: Problème d'occultation statique partielle
|
Figure: Problème d'occultation dynamique partielle
|
L'aspect quantitatif
Selon l'axe quantitatif, les problèmes d'occultation se posent
en termes de quantité de surface occultée. On distingue alors
deux cas: l'occultation partielle laissant une partie de l'objet considéré
visible et l'occultation totale, l'objet ayant dans ce cas totalement disparu
de l'image. La encore, les recours algorithmiques ne sont pas du tout de
la même nature (cf.figures
et
).
Les problèmes dynamiques
La dernière catégorie de difficultés est l'ensemble
des problèmes liés au suivi. Le terme de piste est utilisé
pour qualifier une suite continue de positions d'un objet au cours du temps.
On note l'existence de deux couples de comportements problématiques
de ces pistes : l'initialisation et la terminaison ainsi que le mélange
et l'éclatement.
L'initialisation de piste
L'initialisation de piste est définie par le premier élément
d'une suite de caractéristiques représentant un objet.(voir
figure
)
En fait, le problème de légitimité de cette initialisation
intervient très souvent dans le sens où il n'existe pas forcément
d'adéquation entre l'arrivée d'un objet dans la scène
et le commencement d'une piste. Un objet peut apparaître sans qu'une
piste soit automatiquement ouverte. De même, une piste peut être
ouverte sans qu'un nouvel objet soit apparu, dans le cas d'une piste correspondant
à un objet précédemment occulté, par exemple.
Figure: Les problèmes dynamiques
|
La terminaison de piste
Le problème dual de celui posé par l'initialisation de
piste est celui de la terminaison de piste. Une terminaison de piste est
définie par l'existence d'un dernier élément de la
suite de positions. On constate que ce dernier élément est
associé à la disparition d'un objet de la scène, mais
la disparition d'un objet de l'ensemble des détections ne signifie
pas forcément sa disparition réelle. La encore, ce phénomène
peut être un problème d'occultation par exemple. De façon
générale, les problèmes d'initialisation et de terminaison
de pistes posent le problème des entrées-sorties d'objet
dans la scène.
La fusion de pistes
Le problème de fusion de pistes se pose de façon différente
des deux problèmes précédents. Une fusion de pistes
fait intervenir au moins deux pistes et est qualifiée si il existe
une filiation père-fils de deux objets fils de l'image It-1
distincts vers un unique objet père de l'image It.
Un problème de légitimité se pose encore car certains
cas de mélange peuvent avoir un sens et une légitimité,
alors que d'autres ne peuvent être qualifiés que d'accident
dans les traitements. (voir figure
)
Dans le cas d'un groupe de personnes qui se rejoint en un point de la scène,
on peut considérer comme légitime que les pistes définies
par les trajectoires de chacune des personnes se mélangent. En revanche,
dans le cas d'occultation dynamique (occultation d'un objet mobile par
un autre objet mobile) la légitimité du mélange des
pistes se pose plus difficilement.
L'éclatement de pistes
Le problème dual du mélange est le problème d'éclatement
de piste. On définit un éclatement par une filiation père-fils
d'un unique objet père de l'image It-1
vers deux objets fils distincts de l'image It.
Là encore, certains de ces cas paraissent avoir du sens tel que
la séparation d'un groupe de personnes (voir figure
),
dont on aurait suivi une unique piste (à cause de la proximité
des personnes dans le groupe). D'autres cas, en revanche, relèvent
de l'accident de traitement (un objet réel de la scène bien
détecté jusqu'à l'instant t, dont la détection
à un instant t+1 donne plusieurs objets).
Les problèmes d'incertitude
Une catégorie de problèmes du domaine est la gestion de
l'incertitude à toutes les étapes des traitements. En fait,
il existe différents niveaux d'incertitude que le système
doit savoir gérer. Le plus fin est le bruit inhérent aux
images numérisées. Les effets naturels dans la scène
correspondent à un second niveau d'incertitude et le grain le plus
épais d'imprécision est lié aux objets eux-mêmes.
L'hypothèse du bruit gaussien
Un problème récurrent du traitement d'images est le problème
du bruit introduit par la numérisation préalable des images.
Une numérisation de basse résolution introduit une faible
qualité d'image qui pose problème lors des étapes
de détection et de reconnaissance. Or une numérisation de
haute résolution pose des problèmes de manipulation d'information,
car il s'agit alors de gérer d'importants volumes de données,
ce qui est problématique dans l'élaboration de systèmes
embarqués ou de système temps réel, par exemple. Par
conséquent nous sommes contraint à utilisé des images
de basse résolution. L'hypothèse, la plus communément
envisagée est celle d'un bruit gaussien appliqué à
chaque pixel de l'image. Dans [], l'utilisation d'un modèle de ce
type durant l'étape de détection permet d'estimer le bruit
et ainsi de fiabiliser les résultats. Dans [Du
et al., 1993], les auteurs font mention d'un modèle de bruit
aléatoire combiné au modèle d'objet qu'ils utilisent.
Leur modèle d'objet est défini par un polyèdre 3D,
dont chacune des arêtes est soumise à une <<contamination
aléatoire du bruit>>, définie par deux degrés de liberté
supplémentaires. Il en résulte une intéressante flexibilité
du modèle d'objet.
Les phénomènes
naturels
L'utilisation d'images réelles pose, en soi, un problème.
En effet, de nombreux algorithmes de traitement d'image élaborés
en laboratoire se révèlent inadéquats dans le cadre
d'images réelles (cf.figure
).
Les phénomènes naturels tel que les ombres d'objets, les
réflexions d'objets sur le sol et autres surfaces propices, l'obscurité
et les changements d'illumination sont des problèmes majeurs du
traitement de séquences d'images naturelles. [Koller
et al., 1993] propose, pour faire face aux problèmes d'ombrage,
un modèle d'illumination basé sur l'existence d'une source
lumineuse à l'infini immobile au cours du temps (durant la séquence).
Une ombre théorique de l'objet est alors calculée et prise
en compte lors de l'instanciation du modèle d'objet. Cette méthode
est très intéressante mais ses hypothèses sont très
strictes : elles conviennent, en effet, à des scènes extérieures
(source lumineuse à l'infini) et de courte durée(source lumineuse
immobile au cours du temps).Dans [], les auteurs proposent une solution
possible aux problèmes de changement d'illumination de la scène
par une méthode d'intégration de l'image de référence
utilisée.
Figure: Illustration des problèmes d'incertitudes
|
Les incertitudes objet
Les objets mobiles peuvent parfois apparaître comme indésirables.
Les objets mobiles naturels tels que les objets mus par le vent (ex: feuillage
des arbres) et la pluie doivent être pris en compte. Les artefacts
mobiles sont aussi problématiques. Que leur existence corresponde
à un phénomène périodique, comme un escalator
ou comme un métro (avec une périodicité différente)
ou qu'ils révèlent un phénomène chaotique (apparition
d'un véhicule et tout autre accident dans l'image), les artefacts
mobiles sont un problème sur lequel la littérature est assez
discrète.
Bilan et conclusions
Nous venons de voir, dans cette section la majorité des problèmes
que pose l'élaboration d'un système de traitement de séquence
d'images pour l'interprétation de scène. Bien que de nature,
tout à fait différents, les trois axes, que sont les problèmes
d'occultations, les problèmes de suivis multipistes et sont les
problèmes d'incertitudes doivent rester au premier plan des préoccupations
du concepteur de tels systèmes. Le problème se pose alors
de trouver une architecture générale permettant de savoir,
à quels étapes de la séquence des traitements, quel
problème peut être résolu. Pour concevoir cette architecture,
nous allons voir dans la suite quelques éléments de réponses.
Next: État
de l'art Previous: Introduction
Nathanael Rota
1998-09-22