Ecole Doctorale STIC

Université Nice - Sophia Antipolis

 

 

Unités d'enseignement

Spécialité "Image et géométrie pour le multimédia et la modélisation du vivant"

A1 --- Surfaces et maillages : du lisse au discret

Responsable : Pierre Alliez, CR INRIA
Site web du cours

La ligne directrice de ce cours est l'étude des formes en général et des surfaces de R3 en particulier. Par étude on entend l'analyse des propriétés géométriques différentielles et topologiques. L'objectif du cours est double. D'une part présenter les concepts fondamentaux, et d'autre part replacer ces concepts dans le cadre de la modélisation et du traitement numérique de la géométrie au sens large. Sont ainsi concernés les domaines d'application exploitant de près ou de loin des maillages surfaciques: conception, simulation numérique et multimédia.

ADE1 --- Compression avancée d'images multidimensionnelles

Responsable : Marc Antonini, CR CNRS

La finalité de ce cours est de faire acquérir aux étudiants les notions nécessaires à la maîtrise des principales techniques de compression de l'information. On développe les techniques de quantification : Après une introduction de la quantification scalaire uniforme, on présente les algorithmes d'optimisation du quantificateur de Max-Lloyd Afin de mieux adapter le quantificateur au signal source, plusieurs techniques de mise en forme de l'information sont proposées. Les méthodes prédictives pour les signaux bien corrélés, les techniques par transformées (transformées en cosinus, ondelettes, sous-bandes, hiérarchiques,...) pour les signaux structurés. Pour réaliser un plus fort taux de compression, les méthodes plus modernes de quantification vectorielle sont approfondies : le fameux algorithme LBG pour l'optimisation d'un dictionnaire de codes est présenté. On lui oppose les techniques rapides basées sur les réseaux algébriques. On développe ensuite les techniques de compression sans perte (notion d'entropie, de code à longueur variable) : la présentation de l'algorithme d'Huffman permet de montrer la puissance de ces méthodes, surtout en ce qui concerne les algorithmes adaptatifs comme "Lempel-Ziv" et le "code arithmétique". Ce cours est orienté, de manière à donner les outils mathématiques nécessaires en théorie de l'information. Il conduira naturellement vers une ouverture sur les recherches actuellement menées dans les laboratoires, ainsi que sur les différentes normes en compression (de son, d'images fixes [JPEG, JPEG2000], d'images animées [MPEG-1, -2 et -4, H26x],...).

A3 --- Problèmes inverses

Responsable : Michel Barlaud, Prof UNSA

- Problèmes inverses et Modélisation - Modèles linéaires a bruit additif et multiplicatif - Exemple de problème de restauration et de reconstruction, - Mise en évidence de leur caractère mal-posé - Problème inverse mal pose et conditions de Hadamard - Relation avec les valeurs propres, conditionnement (exemples) - Notion de Régularisation - Régularisation par contrainte sur la norme - Théorème de Bregman Algorithme ART - Entropie, Algorithmes MART,MEM- Régularisation par contrainte sur le Gradient - De la modélisation au critère- Les méthodes variationnelles et le calcul des variations - Théorème Semi-quadratique et Algorithme des minimisations alternées - Optimisation de région : la méthode des gradients de forme

A4 --- Restauration et analyse d'image par analyse fonctionnelle.

Responsable: Laure Blanc-Féraud, DR CNRS
Présentation

Ce cours a pour but de d'écrire des méthodes récentes de restauration et d'analyse d'images. En restauration d'images, ont été développées ces dernières années de nombreux algorithmes reposant sur la transformée en ondelettes, la Variation Totale (TV), les champs markoviens... Le but de ce module est de présenter ces méthodes de manière unifiée dans un cadre fonctionnel rigoureux. Nous serons amenés à considérer, selon les cas, l'espace BV ou les espaces de Besov. Ce formalisme conduit aussi à la description de méthodes récentes de décomposition d'image en une partie géométrique et une partie oscillante. Ce type de décomposition a de très nombreuses applications (remplissage d'images, analyse de textures...). Enfin, tout au long de ce module, nous nous intéresserons au problème de l'estimation des paramètres des fonctionnelles. Les applications sont en imagerie satellitaire, imagerie biologique et imagerie astrophysique.

A5 ---- Structures et interactions (macro-)moléculaires

Responsable: Frédéric Cazals, DR INRIA
Site web du cours

Deux des challenges majeurs de l'ère post-génomique résident dans la compréhension de la machinerie cellulaire et dans le développement de nouvelles méthodes de conception de médicaments. Ces enjeux posent des questions telles que la détermination, la compréhension et l'étude de l'interaction de plusieurs (macro-)molécules ---acides nucléiques, protéines, médicaments. Une de leurs caractéristiques essentielles est de faire intervenir des disciplines aussi variées que la biologie, la chimie, la physique, les mathématiques et l'informatique. L'objectif de ce cours est d'aborder ces questions en insistant particulièrement sur les questions d'algorithmique géométrique qui se posent pour manipuler efficacement ces modèles moléculaires, sans pour autant perdre de vue la pertinence biochimique des modèles et algorithmes développés.

A6 --- Flots géométriques et modélisations en images

Responsable: Rachid Deriche, DR INRIA
Site web du cours

Ce module se donne comme but de fournir aux étudiants les outils modernes et la maîtrise technique nécessaire à la résolution d'une certaine classe de problèmes importants dans le domaine du traitement de l'image, scalaire ou vectorielle, et de la vision artificielle ou biologique. La modélisation, le formalisme variationnel et les flots géométriques à base d'EDP constituent le socle commun au traitement des différents problèmes considérés. On commencera par accorder une attention particulière aux processus qui surviennent dans la phase dite de vision précoce et aux problèmes liés à la modélisation et l'extraction de primitives images et de certaines de leurs configurations singulières. Les techniques les plus avancées dans le domaine de la vision artificielle seront présentées et analysées de manière complète, et on tentera d'établir un parallèle avec certains modèles biologiques existants. On passera ensuite en revue un certain nombre de problèmes en traitement d'image et en vision ayant pour caractéristique commune d'être traités sous forme variationnelle. On introduira pour cela un formalisme d'analyse principalement issu de la théorie des EDP (Équations aux Dérivées Partielles ) pour étudier de manière unifiée, une grande classe de problèmes liés à la segmentation, l'amélioration et la restauration d'images, scalaires ou vectorielles, dégradées par du bruit. Après avoir traité le cas de la régularisation d'images scalaires et vectorielles, on adressera le problème de la segmentation d'images scalaires et vectorielles par évolution de courbes intégrant aussi bien les informations contours que des informations statistiques sur les régions. On traitera le cas des contours actifs géodésiques et on étudiera son extension à celui des régions actives tout en adressant le problème de la mise en oeuvre au travers de la méthode dite des ensembles de niveaux (Osher-Sethian). Toutes ces questions traiteront du cas des images scalaires, mais aussi du cas plus général des images vectorielles, comme les images couleurs, les images de direction ou les images de tenseur de diffusion MRI, etc. L'application à la régularisation de données DT-MRI sera particulièrement illustrée, ce qui permettra de soulever les nouveaux problèmes que posent cette modalité d'acquisition récente en imagerie neuro-fonctionnelle. Enfin, on finira par une courte introduction du concept d'analyse multi-échelle, son axiomatisation, ainsi que sa formalisation à l'aide d'équations aux dérivées partielles. Ceci permettra en particulier de montrer le lien permettant d'unifier un grand nombre de théories précédemment proposées dans la littérature liée aux domaines du traitement des images et de la vision par ordinateur.

A7 --- Techniques algorithmiques en géométrie : l'exemple de la triangulation de Delaunay.

Responsable: Oliver Devillers, DR INRIA
Site web du cours

Le but de ce module est de présenter les grandes tendances de la géométrie algorithmique actuelle, et en particulier son évolution vers ce que nous appellerons le calcul géométrique. Après plusieurs années où la géométrie algorithmique a connu des développements plutôt théoriques, une des grandes questions actuelles est «Comment passer à des algorithmes effectivement programmés ?» Parmi les grands points abordés on citera: comment gérer les problèmes de précision numérique (arithmétique sur les réels), comment gérer les cas dégénérés, et quelle est la vrai complexité d'un algorithme et non pas la complexité asymptotique dans le cas le pire. Tous ces points seront abordés à travers l'exemple de la triangulation de Delaunay.
Le cours A7-bis sur les mêmes sujets mais plus orientés programmation peut être pris en complément. Site web du cours

A8 --- Synthèse d'images et de sons

Responsable: George Drettakis, DR INRIA
Site web du cours

La synthèse d'image est un composant clé des applications de simulation, visualisation, création et jeux d'aujourd'hui. Dans ce cours, on propose une introduction aux techniques de représentation et affichage d'objets tridimensionnels. On introduira en particulier le processus de création d'image, ou " rendu ", qui consiste à transformer un ensemble d'objets tridimensionnels, observés par un observateur virtuel, en une image. En particulier, on décrira les bases mathématiques nécessaires à la représentation et manipulation d'objets 3D, les algorithmes de base pour l'affichage et l'élimination des parties cachées ainsi que les modèles d'éclairage locaux permettant de restituer l'apparence du matériaux de l'objet éclairé par de sources de lumière synthétiques. On présentera également quelques bases mathématiques et algorithmiques pour la modélisation et l'animation d'objets de synthèse et les algorithmes de rendu spécifiques à chaque type de représentation. Enfin, l'utilisation de bibliothèques logicielles standard permettant l'affichage 3D temps-réel comme " OpenGL " ainsi qu'une introduction aux outils de modélisation et rendu utilisés en production comme " Maya " seront abordées.

A9 --- Traitement d'images en sécurité : tatouage et biométrie

Responsable: Jean-Luc Dugelay, Prof Eurecom

Le tatouage permet aux propriétaires ou fournisseurs de contenus de cacher de manière invisible et robuste un message dans un document multimédia numérique, avec pour principal objectif de défendre les droits d'auteurs ou l'intégrité. Il existe un compromis délicat entre plusieurs paramètres : capacité, visibilité et robustesse. La sécurité utilise 3 types d'authentification : quelque chose que vous connaissez, quelque chose que vous possédez ou quelque chose que vous êtes - une biométrie. Parmi les biométries physiques, on trouve les empreintes digitales, la géométrie de la main, la rétine, l'iris ou le visage. Parmi les biométries comportementales, on trouve la signature et la voix. Chaque biométrie inclut des avantages et inconvénients, en termes de performances, coûts, acceptation de la part des utilisateurs, etc. Les systèmes actuels s'orientent donc vers des solutions multimodales. Dans un futur proche, la biométrie devrait jouer un rôle essentiel en sécurité, pour le commerce électronique, mais aussi la personnalisation. Dans ce cours, il sera plus particulièrement étudié les techniques d'identification et vérification des personnes à partir de signaux image et vidéo (acquisition, traitements et algorithmes, performances, etc.).

A10 --- Robotique chirurgicale

Responsable: Hervé Delingette, DR INRIA

Ce cours présente les différentes étapes nécessaires à la mise en oeuvre d'applications robotiques complexes. Il comporte une introduction à la modélisation des équations des robots, la spécification des tâches robotiques, l'utilisation du capteur extéroceptif privilégié qu'est la vision dans les boucles de commande et l'implantation de ces différents éléments dans une architecture de contrôle. Un exemple de robotique médicale illustrera la connexion entre perception et action dans cette introduction générale à la robotique.

A11 --- Affective computing

Responsable: Christine Lisetti, Prof Eurecom

Le module couvrira une collection de sujets en Affective Computing dont : (1) la modélisation des émotions en informatique du point de vue du rôle fonctionnel des émotions chez les humains au niveau de la communication, motivation, prise de décisions, attention, comportement, et apprentissage; (2) l'intégration et la synthèse multimodale de techniques de reconnaissance automatique des émotions; (3) l'expression d'émotions pour la création d'agents synthétiques autonomes (logiciels ou robotiques). Computing.

A12 --- Imagerie volumique / Imagerie médicale

Responsable: Grégoire Malandain, DR INRIA

L'imagerie médicale est une source importante d'image tri- voire quadridiomensionnelles (3D ou 4D). Ces images proviennent de différents capteurs (tomodensitomètre ou scanner X, imagerie par résonance magnétique ou IRM, médecine nucléaire, échographie), chacun possédant ses propres spécificités et limitations. Les volumes de données ainsi générés (un sujet pouvant de plus subir plusieurs examens) nécessitent de la part du spécialiste clinicien un temps d'examen relativement long. Le but de ce cours est d'examiner quelques outils de traitement des images particulièrement adaptés au traitement de ces images que ce soit pour des buts de segmentation, de recalage et d'extraction de paramètres quantitatifs (morphologie mathématique, topologie discrète, ...). Des applications médicales illustreront ou compléteront ce cours.

AC2 --- Indexation et recherche d'information multimédia

Responsable: Bernard Merialdo, Prof Eurecom

Les moteurs de recherche tels que Google sont extrêmement efficaces pour des bases de documents textuels gigantesques. Mais la recherche d'images et de vidéo soulève de nombreux problèmes non encore résolus. L'objectif de ce cours est d'étudier les problèmes et les techniques qui apparaissent dans la construction de moteurs de recherche multimédia. Ce cours fera une introduction sur les principes fondamentaux de la recherche d'information. En particulier, on décrira la structure et la construction des fichiers d'index, les principaux modèles de similarité, et les méthodes d'évaluation. On étudiera également les particularités de la recherche sur le web, par exemple l'indice PageRank de Google. Puis, le cours s'intéressera aux techniques d'analyse d'image et de vidéo permettant d'extraire des descripteurs, en particulier pour la segmentation en plans, le calcul de caractéristiques, la reconnaissance de texte, la classification de vidéo, etc... Finalement, ce cours présentera le standard MPEG-7 pour représenter la description du contenu d'un document multimédia, et décrira quelques applications, telles que les navigateurs vidéo et les systèmes d'informations personnalisées.

A14 --- Vision tridimensionnelle

Responsable: Théodore Papadopoulo, CR INRIA
Site web du cours

Le but est de donner aux étudiants les bases théoriques nécessaires à la vision 3D. On s'intéressera tout particulièrement à la modélisation mathématique des caméras (et systèmes de caméras) et à l'obtention des différents paramètres décrivant celle-ci à partir de mesures images (techniques de (auto-)calibration). Tout au long du cours, on s'intéressera également aux algorithmes permettant la mise en oeuvre pratique de ces modèles à partir de données bruitées. Différentes applications seront décrites : mosaïques, reconstruction stéréo, réalité augmentée.

A16 --- Modélisation de la perception visuelle, le cas du mouvement.

Responsable: Thierry Viéville, DR INRIA
Site web du cours

Une meilleure connaissance des mécanismes de perception visuelle humaine et animale pourrait avoir un impact sur la conception d'algorithmes de vision artificielle. En retour l'étude du cerveau (un enjeu majeur de la médecine pour une population dont l'âge moyen augmente) nécessite la mise en place de modèles, de modules de simulation et d'outils d'analyse STIC très élaborés. Dans ce cours nous aborderons: 1. Architecture d'un Système Visuel: étude comparative biologique et artificiel. Estimations: «where» du mouvement et de la structure de la scène observée et «what» du groupement perceptuel et de l'identification d'objets de la scène. Rôle et le fonctionnement des mécanismes adaptatifs de rétroaction. 2. Modélisation de la perception visuelle du mouvement: équations fondamentales, hypothèses sur l'environnement visuel observés, fusion multi-modalités (inertielles, odométriques), mécanismes d'auto-calibration et d'adaptation, utilisation de mouvements actifs de perception. 3. Etude deux grands mécanismes cognitifs en perception (a) classification et catégorisation visuelle, (b) génération de plans ou de trajectoires.

A17 --- Analyse des contenus audio

Responsable: Christian Wellekens, Prof Eurecom

Ce cours présentera aux étudiants les connaissances de base de la caractérisation du signal de parole à la fois par analyse banc de filtres, par analyse prédictive LPC et analyse homomorphique (cepstrale). On abordera également les techniques statistiques de classification par modèles de Markov cachés en insistant sur les méthodes d'entraînement (Viterbi et Estimate-Maximize). Ces techniques seront appliquées à l'indexation en identifiant des mots clés dans un enregistrement sonore. Les méthodes de segmentation en bruit/parole, musique/parole, en locuteurs seront décrites.

A18 --- Modèles stochastiques en traitement d'image

Responsable: Josiane Zerubia, DR INRIA
Site web du cours

Le but de ce module est de faire une introduction à l'analyse statistique d'image. Nous traiterons principalement des problèmes liés à la modélisation stochastique du signal d'image (champs markoviens, processus objet), aux techniques stochastiques d'optimisation (recuit simulé), aux modèles hiérarchiques, à l'estimation de paramètres pour ces modèles. Pour terminer, quelques applications seront présentées dans le domaine de l'imagerie satellitaire, médicale et biologique.