|
Spécialité "Image et géométrie pour le multimédia et la modélisation du vivant"
A1 --- Surfaces et maillages : du lisse au discret
Responsable : Pierre Alliez, CR INRIA
Site web du cours
La ligne directrice de ce cours est l'étude des formes en général et
des surfaces de R3 en particulier. Par étude on entend
l'analyse des propriétés géométriques différentielles et topologiques.
L'objectif du cours est double. D'une part présenter les
concepts fondamentaux, et d'autre part replacer ces concepts dans le
cadre de la modélisation et du traitement numérique de la
géométrie au sens large. Sont ainsi concernés les domaines d'application
exploitant de près ou de loin des maillages
surfaciques: conception, simulation numérique et multimédia.
ADE1 --- Compression avancée d'images multidimensionnelles
Responsable : Marc Antonini, CR CNRS
La finalité de ce cours est de faire acquérir aux étudiants les notions
nécessaires à la maîtrise des principales techniques de
compression de l'information. On développe les techniques de quantification :
Après une introduction de la quantification
scalaire uniforme, on présente les algorithmes d'optimisation du
quantificateur de Max-Lloyd Afin de mieux adapter le
quantificateur au signal source, plusieurs techniques de mise en forme
de l'information sont proposées. Les méthodes
prédictives pour les signaux bien corrélés, les techniques par
transformées (transformées en cosinus, ondelettes, sous-bandes,
hiérarchiques,...) pour les signaux structurés. Pour réaliser un plus
fort taux de compression, les méthodes plus modernes de
quantification vectorielle sont approfondies : le fameux algorithme LBG
pour l'optimisation d'un dictionnaire de codes est
présenté. On lui oppose les techniques rapides basées sur les réseaux
algébriques.
On développe ensuite les techniques de compression sans perte
(notion d'entropie, de code à longueur variable) : la
présentation de l'algorithme d'Huffman permet de montrer la puissance
de ces méthodes, surtout en ce qui concerne les
algorithmes adaptatifs comme "Lempel-Ziv" et le "code arithmétique".
Ce cours est orienté, de manière à donner les outils
mathématiques nécessaires en théorie de l'information. Il conduira
naturellement vers une ouverture sur les recherches
actuellement menées dans les laboratoires, ainsi que sur les
différentes normes en compression (de son, d'images fixes [JPEG,
JPEG2000], d'images animées [MPEG-1, -2 et -4, H26x],...).
A3 --- Problèmes inverses
Responsable : Michel Barlaud, Prof UNSA
- Problèmes inverses et Modélisation - Modèles linéaires a bruit additif
et multiplicatif - Exemple de problème de restauration
et de reconstruction, - Mise en évidence de leur caractère mal-posé -
Problème inverse mal pose et conditions de Hadamard -
Relation avec les valeurs propres, conditionnement (exemples) -
Notion de Régularisation - Régularisation par contrainte sur la
norme - Théorème de Bregman Algorithme ART - Entropie, Algorithmes MART,MEM-
Régularisation par contrainte sur le
Gradient - De la modélisation au critère- Les méthodes variationnelles et le
calcul des variations - Théorème Semi-quadratique
et Algorithme des minimisations alternées - Optimisation de région :
la méthode des gradients de forme
A4 --- Restauration et analyse d'image par analyse fonctionnelle.
Responsable: Laure Blanc-Féraud, DR CNRS
Présentation
Ce cours a pour but de d'écrire des méthodes récentes de restauration
et d'analyse d'images. En restauration d'images, ont été
développées ces dernières années de nombreux algorithmes reposant sur
la transformée en ondelettes, la Variation Totale
(TV), les champs markoviens... Le but de ce module est de présenter ces
méthodes de manière unifiée dans un cadre
fonctionnel rigoureux. Nous serons amenés à considérer, selon les cas,
l'espace BV ou les espaces de Besov. Ce formalisme
conduit aussi à la description de méthodes récentes de décomposition d'image
en une partie géométrique et une partie
oscillante. Ce type de décomposition a de très nombreuses applications
(remplissage d'images, analyse de textures...). Enfin,
tout au long de ce module, nous nous intéresserons au problème de
l'estimation des paramètres des fonctionnelles. Les
applications sont en imagerie satellitaire, imagerie biologique et
imagerie astrophysique.
A5 ---- Structures et interactions (macro-)moléculaires
Responsable: Frédéric Cazals, DR INRIA
Site web du cours
Deux des challenges majeurs de l'ère post-génomique résident dans la
compréhension de la machinerie cellulaire et dans le
développement de nouvelles méthodes de conception de médicaments.
Ces enjeux posent des questions telles que la
détermination, la compréhension et l'étude de l'interaction de plusieurs
(macro-)molécules ---acides nucléiques, protéines,
médicaments. Une de leurs caractéristiques essentielles est de faire
intervenir des disciplines aussi variées que la biologie, la
chimie, la physique, les mathématiques et l'informatique.
L'objectif de ce cours est d'aborder ces questions en insistant
particulièrement sur les questions d'algorithmique géométrique qui se
posent pour manipuler efficacement ces modèles
moléculaires, sans pour autant perdre de vue la pertinence biochimique
des modèles et algorithmes développés.
A6 --- Flots géométriques et modélisations en images
Responsable: Rachid Deriche, DR INRIA
Site web du cours
Ce module se donne comme but de fournir aux étudiants les outils modernes
et la maîtrise technique nécessaire à la résolution
d'une certaine classe de problèmes importants dans le domaine du traitement
de l'image, scalaire ou vectorielle, et de la vision
artificielle ou biologique. La modélisation, le formalisme variationnel et
les flots géométriques à base d'EDP constituent le
socle commun au traitement des différents problèmes considérés.
On commencera par accorder une attention particulière aux processus qui
surviennent dans la phase dite de vision précoce et
aux problèmes liés à la modélisation et l'extraction de primitives images
et de certaines de leurs configurations singulières. Les
techniques les plus avancées dans le domaine de la vision artificielle
seront présentées et analysées de manière complète, et on
tentera d'établir un parallèle avec certains modèles biologiques existants.
On passera ensuite en revue un certain nombre de problèmes en traitement
d'image et en vision ayant pour caractéristique
commune d'être traités sous forme variationnelle. On introduira pour cela
un formalisme d'analyse principalement issu de la
théorie des EDP (Équations aux Dérivées Partielles ) pour étudier de manière
unifiée, une grande classe de problèmes liés à la
segmentation, l'amélioration et la restauration d'images, scalaires ou
vectorielles, dégradées par du bruit. Après avoir traité le
cas de la régularisation d'images scalaires et vectorielles, on adressera
le problème de la segmentation d'images scalaires et
vectorielles par évolution de courbes intégrant aussi bien les informations
contours que des informations statistiques sur les
régions. On traitera le cas des contours actifs géodésiques et on étudiera
son extension à celui des régions actives tout en
adressant le problème de la mise en oeuvre au travers de la méthode dite
des ensembles de niveaux (Osher-Sethian). Toutes ces
questions traiteront du cas des images scalaires, mais aussi du cas plus
général des images vectorielles, comme les images
couleurs, les images de direction ou les images de tenseur de diffusion MRI,
etc. L'application à la régularisation de données
DT-MRI sera particulièrement illustrée, ce qui permettra de soulever les
nouveaux problèmes que posent cette modalité
d'acquisition récente en imagerie neuro-fonctionnelle.
Enfin, on finira par une courte introduction du concept d'analyse
multi-échelle, son axiomatisation, ainsi que sa formalisation à
l'aide d'équations aux dérivées partielles. Ceci permettra en particulier de
montrer le lien permettant d'unifier un grand nombre
de théories précédemment proposées dans la littérature liée aux domaines
du traitement des images et de la vision par
ordinateur.
A7 --- Techniques algorithmiques en géométrie :
l'exemple de la triangulation de Delaunay.
Responsable: Oliver Devillers, DR INRIA
Site web du cours
Le but de ce module est de présenter les grandes tendances de
la géométrie algorithmique actuelle, et en particulier son
évolution vers ce que nous appellerons le calcul géométrique.
Après plusieurs années où la géométrie algorithmique a connu
des développements plutôt théoriques, une des grandes questions
actuelles est «Comment passer à des algorithmes
effectivement programmés ?» Parmi les grands points abordés on citera:
comment gérer les problèmes de précision numérique
(arithmétique sur les réels), comment gérer les cas dégénérés, et
quelle est la vrai complexité d'un algorithme et non pas la
complexité asymptotique dans le cas le pire. Tous ces points seront
abordés à travers l'exemple de la triangulation de Delaunay.
Le cours A7-bis sur les mêmes sujets mais plus orientés programmation
peut être pris en complément.
Site web du cours
A8 --- Synthèse d'images et de sons
Responsable: George Drettakis, DR INRIA
Site web du cours
La synthèse d'image est un composant clé des applications de simulation,
visualisation, création et jeux d'aujourd'hui. Dans ce
cours, on propose une introduction aux techniques de représentation et
affichage d'objets tridimensionnels. On introduira en
particulier le processus de création d'image, ou " rendu ", qui consiste
à transformer un ensemble d'objets tridimensionnels,
observés par un observateur virtuel, en une image.
En particulier, on décrira les bases mathématiques nécessaires à la
représentation et manipulation d'objets 3D, les algorithmes
de base pour l'affichage et l'élimination des parties cachées ainsi que
les modèles d'éclairage locaux permettant de restituer
l'apparence du matériaux de l'objet éclairé par de sources de lumière
synthétiques. On présentera également quelques bases
mathématiques et algorithmiques pour la modélisation et l'animation
d'objets de synthèse et les algorithmes de rendu
spécifiques à chaque type de représentation.
Enfin, l'utilisation de bibliothèques logicielles standard permettant
l'affichage 3D temps-réel comme " OpenGL " ainsi qu'une
introduction aux outils de modélisation et rendu utilisés en production
comme " Maya " seront abordées.
A9 --- Traitement d'images en sécurité : tatouage et biométrie
Responsable: Jean-Luc Dugelay, Prof Eurecom
Le tatouage permet aux propriétaires ou fournisseurs de contenus de
cacher de manière invisible et robuste un message dans un
document multimédia numérique, avec pour principal objectif de défendre
les droits d'auteurs ou l'intégrité. Il existe un
compromis délicat entre plusieurs paramètres : capacité, visibilité et
robustesse.
La sécurité utilise 3 types d'authentification : quelque chose que vous
connaissez, quelque chose que vous possédez ou quelque
chose que vous êtes - une biométrie. Parmi les biométries physiques, on
trouve les empreintes digitales, la géométrie de la
main, la rétine, l'iris ou le visage. Parmi les biométries comportementales,
on trouve la signature et la voix. Chaque biométrie
inclut des avantages et inconvénients, en termes de performances, coûts,
acceptation de la part des utilisateurs, etc. Les
systèmes actuels s'orientent donc vers des solutions multimodales.
Dans un futur proche, la biométrie devrait jouer un rôle
essentiel en sécurité, pour le commerce électronique, mais aussi la
personnalisation. Dans ce cours, il sera plus
particulièrement étudié les techniques d'identification et vérification
des personnes à partir de signaux image et vidéo
(acquisition, traitements et algorithmes, performances, etc.).
A10 --- Robotique chirurgicale
Responsable: Hervé Delingette, DR INRIA
Ce cours présente les différentes étapes nécessaires à la mise en oeuvre
d'applications robotiques complexes. Il comporte une introduction à la
modélisation des équations des robots, la spécification des
tâches robotiques,
l'utilisation du capteur extéroceptif privilégié qu'est la vision dans les
boucles de commande et l'implantation de ces différents éléments dans une
architecture de contrôle. Un exemple de robotique médicale illustrera la
connexion entre perception et action dans cette introduction générale à la
robotique.
A11 --- Affective computing
Responsable: Christine Lisetti, Prof Eurecom
Le module couvrira une collection de sujets en Affective Computing dont :
(1) la modélisation des émotions en informatique
du point de vue du rôle fonctionnel des émotions chez les humains au
niveau de la communication, motivation, prise de
décisions, attention, comportement, et apprentissage;
(2) l'intégration et la synthèse multimodale de techniques de
reconnaissance automatique des émotions;
(3) l'expression d'émotions pour la création d'agents synthétiques autonomes
(logiciels ou robotiques). Computing.
A12 --- Imagerie volumique / Imagerie médicale
Responsable: Grégoire Malandain, DR INRIA
L'imagerie médicale est une source importante d'image tri- voire
quadridiomensionnelles (3D ou 4D). Ces images proviennent
de différents capteurs (tomodensitomètre ou scanner X, imagerie par
résonance magnétique ou IRM, médecine nucléaire,
échographie), chacun possédant ses propres spécificités et limitations.
Les volumes de données ainsi générés (un sujet pouvant de plus subir
plusieurs examens) nécessitent de la part du spécialiste
clinicien un temps d'examen relativement long. Le but de ce cours est
d'examiner quelques outils de traitement des images
particulièrement adaptés au traitement de ces images que ce soit pour
des buts de segmentation, de recalage et d'extraction de
paramètres quantitatifs (morphologie mathématique, topologie discrète, ...).
Des applications médicales illustreront ou
compléteront ce cours.
AC2 --- Indexation et recherche d'information multimédia
Responsable: Bernard Merialdo, Prof Eurecom
Les moteurs de recherche tels que Google sont extrêmement efficaces pour des
bases de documents textuels gigantesques. Mais la recherche d'images et de
vidéo soulève de nombreux problèmes non encore résolus. L'objectif de ce
cours est d'étudier les problèmes et les techniques qui apparaissent dans la
construction de moteurs de recherche multimédia.
Ce cours fera une introduction sur les principes fondamentaux de la
recherche d'information. En particulier, on décrira la structure et la
construction des fichiers d'index, les principaux modèles de similarité, et
les méthodes d'évaluation. On étudiera également les particularités de la
recherche sur le web, par exemple l'indice PageRank de Google.
Puis, le cours s'intéressera aux techniques d'analyse d'image et de vidéo
permettant d'extraire des descripteurs, en particulier pour la segmentation
en plans, le calcul de caractéristiques, la reconnaissance de texte, la
classification de vidéo, etc...
Finalement, ce cours présentera le standard MPEG-7 pour représenter la
description du contenu d'un document multimédia, et décrira quelques
applications, telles que les
navigateurs vidéo et les systèmes d'informations personnalisées.
A14 --- Vision tridimensionnelle
Responsable: Théodore Papadopoulo, CR INRIA
Site web du cours
Le but est de donner aux étudiants les bases théoriques nécessaires à la
vision 3D. On s'intéressera tout particulièrement à la
modélisation mathématique des caméras (et systèmes de caméras) et à
l'obtention des différents paramètres décrivant celle-ci à
partir de mesures images (techniques de (auto-)calibration). Tout au
long du cours, on s'intéressera également aux algorithmes
permettant la mise en oeuvre pratique de ces modèles à partir de données
bruitées.
Différentes applications seront décrites : mosaïques, reconstruction stéréo,
réalité augmentée.
A16 --- Modélisation de la perception visuelle, le cas du mouvement.
Responsable: Thierry Viéville, DR INRIA
Site web du cours
Une meilleure connaissance des mécanismes de perception visuelle humaine
et animale pourrait avoir un impact sur la
conception d'algorithmes de vision artificielle. En retour l'étude du cerveau
(un enjeu majeur de la médecine pour une
population dont l'âge moyen augmente) nécessite la mise en place de modèles,
de modules de simulation et d'outils d'analyse
STIC très élaborés. Dans ce cours nous aborderons:
1. Architecture d'un Système Visuel: étude comparative biologique et
artificiel. Estimations: «where» du mouvement et de la
structure de la scène observée et «what» du groupement perceptuel
et de l'identification d'objets de la scène. Rôle et le
fonctionnement des mécanismes adaptatifs de rétroaction.
2. Modélisation de la perception visuelle du mouvement: équations
fondamentales, hypothèses sur l'environnement visuel
observés, fusion multi-modalités (inertielles, odométriques),
mécanismes d'auto-calibration et d'adaptation, utilisation de
mouvements actifs de perception.
3. Etude deux grands mécanismes cognitifs en perception
(a) classification et catégorisation visuelle,
(b) génération de plans ou de trajectoires.
A17 --- Analyse des contenus audio
Responsable: Christian Wellekens, Prof Eurecom
Ce cours présentera aux étudiants les connaissances de base de la caractérisation du signal de parole à la fois par analyse banc
de filtres, par analyse prédictive LPC et analyse homomorphique (cepstrale). On abordera également les techniques statistiques
de classification par modèles de Markov cachés en insistant sur les méthodes d'entraînement (Viterbi et Estimate-Maximize).
Ces techniques seront appliquées à l'indexation en identifiant des mots clés dans un enregistrement sonore. Les méthodes de
segmentation en bruit/parole, musique/parole, en locuteurs seront décrites.
A18 --- Modèles stochastiques en traitement d'image
Responsable: Josiane Zerubia, DR INRIA
Site web du cours
Le but de ce module est de faire une introduction à l'analyse
statistique d'image. Nous traiterons principalement des problèmes
liés à la modélisation stochastique du signal d'image
(champs markoviens, processus objet), aux techniques stochastiques
d'optimisation (recuit simulé), aux modèles hiérarchiques,
à l'estimation de paramètres pour ces modèles. Pour terminer,
quelques applications seront présentées dans le domaine de
l'imagerie satellitaire, médicale et biologique.
|