|
|
|
|
|
|
un nouveau concept pour représenter la position relative d'objets |
Docteur, IRIT Université Paul Sabatier Toulouse |
18 janvier | 14h00 | Salle 003 |
|
Ingénieur en Chef des Télécommunications Maître de Conférences - département Signal et Images ENST, Paris |
3 février | 10h30 | Salle 003 |
|
Ecole Nationale Supérieure Polytechnique de Yaoundé Cameroun |
1er mars | 14h00 | Salle 003 |
|
Laboratoire IMAG - LMC, Grenoble |
19 avril | 14h00 | Salle 002 |
|
Dept. of Engineering University of Cambridge, UK |
31 mai | 14h00 | Salle 003 |
|
Department of Electrical and Computer Engineering University of Illinois at Urbana-Champaign USA |
29 juin | 14h00 | Salle 003 |
à partir de plusieurs images aériennes |
Departement TSI ENST Paris |
12 juillet | 14h00 | Salle 003 |
|
Hewlett-Packard Laboratories - Israel The Technion Israel Institute of technology Haifa |
2 septembre | 14h00 | Salle 003 |
|
INO Quebec, Canada |
20 septembre | 14h00 | Salle 003 |
|
Texas Instruments Dallas Texas, USA |
15 octobre | 14h00 | Salle 003 |
|
INO Quebec, Canada |
18 novembre | 16h00 | Salle 002 |
|
NASA Ames Research Center, Moffet Field, USA |
25 novembre | 10h30 | Salle 003 |
|
CEREMADE, Université Paris IX Dauphine |
6 décembre | 14h00 | Salle 003 |
|
Moscow State University Faculty of Mathematics and Mechanics Moscow, Russie |
15 décembre | 10h30 | Salle 003 |
Dans le domaine de la vision par ordinateur, il est essentiel de savoir
appréhender l'organisation spatiale d'objets bidimensionnels. À l'heure
actuelle, un histogramme d'angles constitue peut-être le moyen le plus
achevé de représenter la position relative de deux objets. De nombreux
travaux s'appuient, de manière plus ou moins explicite, sur ce mode de
représentation.
Nous avons développé un nouveau concept, qui généralise et supplante
celui d'histogramme d'angles : le concept de F-histogramme. La
manipulation des objets (entités de dimension 2) est ramenée à celle de leurs
sections longitudinales (entités de dimension 1), non pas à celle de points. Il
est ainsi possible de bénéficier de la puissance du calcul intégral et
d'assurer un traitement incomparablement plus rapide aussi bien de données
vecteurs que rasters, d'objets flous que nets, tout en tenant compte
explicitement aussi bien de l'information métrique que de l'information
angulaire.
Typiquement, une représentation de la position relative de deux objets
est utilisée pour évaluer les relations spatiales directionnelles entre ces
objets (relations telles que "au sud de", "à droite de"...). Nous sommes
partis de ce constat en adoptant une démarche axiomatique fonctionnelle
rigoureuse. Aussi le concept de F-histogramme offre-t-il de solides garanties
théoriques. Son ouverture et sa flexibilité en font par ailleurs une
réelle plateforme d'exploration dans le domaine de la représentation de la
position relative d'objets.
Une première application des F-histogrammes est évidemment la génération
de relations directionnelles, et ils s'y prêtent avec une grande
souplesse.
En particulier, des familles foncièrement nouvelles de relations
directionnelles peuvent être générées : des familles qui correspondent à une
perception cohérente et rationnelle du monde, mais auxquelles le concept
d'histogramme d'angles n'est pas en mesure de donner le jour.
On rappelle dans un premier temps les principes des deux méthodes
expectation-maximization (EM) et du gradient stochastique (SG) dans le
cas de la restauration d'images par champs markoviens.
On les compare théoriquement dans le cas général, puis expérimentalement
dans le cas de la restauration d'images avec un processus bord (contour)
explicite.
Les images Radar à Synthèse d'Ouverture ouvrent la possibilité de cartographier des zones du globe difficilement accessibles et généralement peu visibles par les systèmes optiques, du fait du fait des conditions climatiques. C'est le cas des régions tropicales et équatoriales.
Nos travaux visent à contribuer à la mise en oeuvre de la télédétection des ressources terrestres en zones tropicales. Dans ces zones l'utilisation des données dans le domaine du visible et le proche infrarouge est limitée par la couverture nuageuse quasi-permanente, l'imagerie RSO offre des perspectives intéressantes grâce à la faible sensibilité aux conditions atmosphériques et à la possibilité d'accéder à des paramètres différents et complémentaires de ceux détectés dans le visible.
Cependant les images RSO comportent "un bruit" connu sous le nom de
chatoiement (Speckle), ce phénomène est caractéristique des
interférences des ondes cohérentes déphasées rétrodiffusées par des
cibles. Par ailleurs les images RSO nécessitent des débits de
transmission très élevés et des grandes capacités de stockage limitant
la mise en oeuvre des systèmes en temps réel ; système d'informations
géographiques distribués, système de suivi de l'évolution d'une
thématique donnée (urbanisation, déforestation,...). De telles applications exploitent plusieurs séquences de données multitemporelles. Dès lors la compression est une étape d'utilité essentielle pour la mise en oeuvre des algorithmes ultérieurs.
Plusieurs algorithmes de compression existent (Notamment la Norme JPEG), mais la plupart de ces algorithmes sont adaptés à des images de scènes naturelles qui correspondent à des signaux généralement stationnaires et dont les pixels sont fortement corrélés entre eux. Ces méthodes usuelles exploitent les redondances intrinsèques aux images et adaptent le contenu informationnel aux capacités limitées de l'oeil humain pour une interprétation psychovisuelle.
Pour des applications de télédétection Radar la problématique est différente, pour deux raisons principales :
La première est la spécificité des images RSO qui comportent généralement des non stationnarités et une faible corrélation des pixels due à la présence du speckle.
La deuxième est que le critère de qualité de la compression n'est plus simplement un meilleur rendu psychovisuel , mais intègre d'autres préoccupations telles que la préservation des textures et des contours de l'image ou d'une manière générique la préservation des zones d'intérêt.
La préservation des zones d'intérêt suppose une étape préalable d'identification automatique des régions, d'où la nécessité de combiner les approches de segmentation et de compression.
Notre idée est donc dans ce cadre d'utiliser les espaces ayant la propriété de fournir des représentations compactes du signal (ondelettes et paquets d'ondelettes) et de pouvoir faire une segmentation sur la base des paramètres du signal dans ces espaces de représentation (coefficients de la transformée ondelettes ou paquets d'ondelettes).
L'intérêt est de pouvoir intégrer dans une même approche les processus de compression et de segmentation et d'évaluer la performance des modèles sur des images RSO ou des séquences de données multitemporelles RSO.
Les applications cibles des modèles mis en oeuvre concernent les systèmes d'informations géographiques distribués dans lesquels le stockage des données, la transmission et décompression en temps réel représentent les contraintes majeures des systèmes opérationnels .Par ailleurs la compression des séquences multitemporelles intègre le suivi temporel des contenus thématiques ,ce qui répond à la problématique de suivi de la dynamique d'occupation des sols (urbanisation, déforestation).
Nous nous proposons de développer une méthode de régularisation pour
le lissage de fonctions observées avec un bruit, analogue a la méthode
de lissage par splines mais pour des fonctions moins régulières. La
régularité des signaux a débruiter est mesurée par leur norme dans des espaces de
Besov. La fonctionnelle de coût à minimiser est obtenue à l'aide d'une version
modifiée de la fonctionnelle K de Peetre. La solution optimale est alors obtenue
par un rétrecissement approprié des coefficients empiriques d'ondelettes.
Une version spécifique de validation croisée est analysée pour le choix du
paramètre de lissage. Quelques exemples numériques illustreront la méthode.
We first review how wavelets may be used for multi-resolution image
processing, describing the filter-bank implementation of the discrete
wavelet transform (DWT) and how it may be extended via separable
filtering for processing images and other multi-dimensional signals. We
then show that the condition for inversion of the DWT (perfect
reconstruction) forces many commonly used wavelets to be similar in
shape, and that this shape produces severe shift variance (variation of
DWT coefficient energy at any given scale with shift of the input
signal). It is also shown that separable filtering with the DWT prevents
the transform from providing directionally selective filters for
diagonal image features.
Complex wavelets can provide both shift invariance and good directional
selectivity, with only modest increases in signal redundancy and
computation load. However development of a complex wavelet transform
(CWT) with perfect reconstruction and good filter characteristics has
proved difficult until recently. We now propose the Dual-Tree CWT
as a solution to this problem, yielding a transform with attractive
properties for a range of signal and image processing applications,
including motion estimation, denoising, texture analysis and synthesis,
and object segmentation.
The average sampling rate required to guarantee signal reconstruction
is lower-bounded, as shown by Landau, by the Lebesgue measure of the
spectral support of the signal. In contrast, for signals with sparse
but poorly packable spectral support such as a thin annular region in
2-D, the multi-D Nyquist rate required to avoid aliasing can be much
higher than this so called minimum rate. This talk a presents
a universal sampling and reconstruction scheme that guarantees perfect
reconstruction of M-D multiband signals not only at asymptotically the
minimum rate, but also without prior knowledge of their spectral
support. Only minimal knowledge, of a bounding box of the support and
a bound on its occupancy rate (non-zero fraction) is required. The
scheme can be applied to both continuous-time sampling and
discrete-time down-sampling of multiband signals. We discuss
applications to Fourier imaging systems and to image compression by
minimally redundant acquisition.
Nous présentons une nouvelle approche pour la détection et l'extraction de bâtiments
à partir de plusieurs images aériennes en milieu urbain dense. Cette approche
s'appuie sur la reconstruction précise de surfaces 3D, suivie de l'extraction des façades
visibles, qui sont ensuite utilisées comme support à la détection des bâtiments.
Des cartes de disparité sont tout d'abord calculées à partir de plusieurs paires
d'images en géométrie épipolaire. Un procédure d'interpolation de la disparité
par des plans utilisant une méthode d'estimation robuste fournit ensuite des
cartes de disparité denses.
A partir de ces cartes de disparité denses, la détection des façades est réalisée
par comptage des projections des points 3D sur une grille horizontale
d'accumulateurs. Une transformation de Hough permet ensuite de délimiter dans
cette grille d'accumulateurs les segments correspondant aux façades qui sont
géoréférencées et orientées. Des hypothèses de bâtiments sont ensuite émises sur les
régions adjacentes à ces façades, puis vérifiées et propagées aux régions voisines.
L'approche est testée sur des scènes urbaines denses et complexes et montre de
bonnes performances.
Super-resolution reconstruction algorithms perform a fusion of several
low quality images of the same scene into a single improved quality image.
In its classic form, this process presents a STATIC estimation problem,
since no temporal axis is involved. A DYNAMIC counterpart process can be
defined, where a continuous image sequence is to be restored from a blur,
decimation (i.e. loss of resolution), and additive noise. This application could be
regarded as a simple extension of the well known image sequence
restoration problem. However, from a different perspective, one could suggest
solving the dynamic problem by applying a static super-resolution process at
each temporal point, fusing all the causal measured images.
In this talk, these two super resolution reconstruction problems will be
analyzed. Solutions for them both will be presented, based on simple yet
effective models. A solution for the static problem will be constructed
first, based on the ML and the MAP estimators. Based on these
solutions, a framework for solving the dynamic problem will be presented as well,
suggesting adaptive filtering efficient approximations of the Kalman filter.
Nous proposons une methode non-supervisee pour la segmentation d'images
multispectrales de type Landsat
dans un contexte de classification des regions par type d'arbres
rencontrees en exploitation forestiere.
Une premiere etape de segmentation est d'abord realisee a l'aide d'une
quantification vectorielle et non-supervisee
des pixels. A l'aide d'un modele Markovien, dont on estime les
parametres, on procede ensuite a une seconde segmentation plus fine en
utilisant un estimateur MAP iteratif. Un exemple de l'application de la
methode sera fourni ainsi qu'une discussion de ses performance en
rapport avec les donnees terrain disponibles.
Digital cameras use a single CCD to acquire color information in a scene
by sampling in three color planes (R, G, B) at each pixel. The image is
subsequently reconstructed by interpolation of available neighborhood
information. The error due to interpolation is strictly a function of
the algorithm used.
It is important that attention is paid to the quality of
the image reconstruction algorithms. We discuss a variety of methods
namely, bilinear interpolation, kernel density estimation, spatial
prediction using kriging, cokriging, Hierarchical models using EM, and
Artificial neural networks. In addition to applications in digital
imaging, these methodologies has extensive applications in semiconductor
manufacturing, medical diagnostics, and environmental pollution.
La presentation portera sur des travaux recents effectues a
l'Institut national optique de Quebec en collaboration avec l'Universite
McGill
de Montreal. Une methode non-supervisee pour l'apprentissage de l'espace
couleur d'objets sous des conditions d'eclairage diurne externe et
utilisant un
modele physique a ete developpee. La methode suppose une connaissance
a-priori de la reflectance des objets et se base sur le modele de
formation des
couleurs (CIE daylight model) de Judd, MacAdam et Wyszecki pour la
representation
typique de la distribution spectrale de l'illuminance diurne. Ceci
permet d'obtenir la
segmentation d'un espace couleur qui est utilise pour l'etape
d'apprentissage. Il est
ainsi possible de detecter des objets couleur tout en tenant compte de
la variation
des couleurs en fonction des variations d'eclairage.
Les presents travaux ont ete appliques au probleme de detection et de
reconnaissance
temps reel de panneaux de signalisation routiere.
In computer graphics, the 3-D surface and its reflectance
properties are assumed known, as are the lighting conditions. Given this
information and the particular camera location and imaging properties,
an
image can be computed (i.e. what the camera would see). Computer vision
can be regarded as solving the inverse graphics problem -- i.e. given a
set of images, what is the most likely surface, lighting and camera
properties that would have generated them. Bayesian inference is a
general
statistical method for solving inverse problems, so we have applied
Bayesian inference to this surface reconstruction problem. Because
camera
pixels in different images receive light from different, but overlapping
patches on the surface, it is necessary to represent the surface at
higher
resolution than implied by any particular pixel (i.e. the surface is
super
resolved). The more overlapping images, the higher the level of super
resolution that can be supported. Because of the complexity of the
problem, our initial research was focused on 2-D surface reconstruction.
This yielded excellent results and has served as a stepping stone to
solving the full 3-D surface reconstruction problem. Preliminary results
for 3-D will be presented, and the overall approach compared to existing
computer vision approaches.
Différentes implémentations "globales" ont à ce jour constitué une
alternative
aux implémentations "locales" de methodes utilisees en traitement des
images.
Ce fut le cas des snakes geometriques puis des implémentations
morphologiques
des équations de lissage anisotrope.
Apres un rappel sur la problématique et l'utilité de ces méthodes, nous
présenterons une implémentation de la minimisation de la Variation
Totale liée a la formule de la coaire.
Investigation of remote sensing information and corresponding maps
for an operative control is one of the main steps of environmental
monitoring.
Boundaries of nature areas, some specific points on the surface, so
called ground control points, or GCP, are kept in digital form in geographic
databases.
These data are changed with new information during the monitoring.
One of the problems of remote sensing applications is geometric distortion of
digital images with comparing to the map of the corresponding areas. This distortion
has a complex structure and relates with the process of measurement and nature
conditions. Usually it can be divided in systematic (deterministic) and stochastic
(random) parts and as a rule traditional methods of remote sensing image thematic
interpretation as areas on the corresponding map with a given projection and scale are
ineffective. It needs a special mathematical model and technique for preliminary
transformation of such data. The result of the transformation has to be an approximation
surface with a given maximal coordinate difference for GCPs on the map and that
surface.
We apply the kriging approximation for correction of geometric
distortions in digital images. The corresponding mathematical model is proposed
and discussed. The complex stochastic part of such model allows us to approximate the
transformation more accurate and estimate the errors. Algorithms for evaluation of the
model parameters and error of approximation are considered. The results of numerical
experiments for simulated and real data main are presented.