Le projet AMIRIA du programme  ROBEA .
logo-author
Présentation
Partenaires
Résultats
Perspectives
Rapport final du préprojet


Présentation
Le projet AMIRIA (Analyse du Mouvement dans des séquences d'Images par Réseaux de neurones Impulsionnels et Asynchrones) a été financé en 2002-3 comme préprojet par le programme ROBEA.
Notre but est le développement de systèmes capables de permettre la "reconnaissance robuste d'objets à partir de données sensorielles", dans le contexte de scènes dynamiques. Il s'agit d'une collaboration résolument multidisciplinaire, associant un laboratoire de recherche CNRS travaillant sur les bases cérébrales de la reconnaissance rapide, un centre de recherche INRIA connaissant très bien les aspects algorithmiques du traitement visuel, une société de valorisation, SpikeNet Technology SARL, et un laboratoire du Max Planck Institut en Allemagne.

Depuis plusieurs années, Simon Thorpe et son équipe au Centre de Recherche Cerveau et Cognition travaille sur le traitement d'images statiques. Ils ont réalisé de nombreuses expériences sur la capacité des sujets humains à catégoriser des images naturelles présentée de façon très brève. Par exemple, ils ont montré (Rousselet, Fabre-Thorpe et Thorpe, 2002) que le système visuel de l'homme peut traiter deux images présentées simultanément à droite et à gauche par rapport au point de fixation et que le temps de traitement est identique au temps requise pour traiter une seule image. Ceci démontre que les traitements sous-jacents sont bel et bien parallèles. Ce type de résultat est un des motivations qui les ont poussé à développer SpikeNet - un système de traitement d'images basé sur des neurones impulsionnels et asynchrones.
À l'INRIA Sophia-Antipolis, l'équipe d'Olivier Faugeras se consacre à une analyse mathématique poussée des principes de fonctionnement du modèle de Thorpe en essayant de comprendre les liens entre ce type de traitement "biologiquement-inspiré" et des approches plus classique en  vision par machine. Elle a adaptée une approche s'inspirant de la théorie de Vapnik pour expliquer les bonnes performances des mécanismes précédents et proposer un mécanisme d'apprentissage.  Pour l'INRIA, ce projet s'est inscrit dans le cadre de nouvelles études menées au sein de la nouvelle équipe d'Olivier Faugeras  en interaction avec des projets Européens (Projet Mapawamo et Insight2+ où le CERCO ést présent) et Nationaux (ACI NeuroSciences, dit RIVAGe). Le but de la seconde phase de ce projet est de développer une extension des travaux de Thorpe au cas de la reconnaissance d'objets dans des scènes dynamiques: elle se fera à partir de ces modèles ``variationels''  d'analyse du mouvement élaborés en vision artificielle.
Le troisième partenaire, SpikeNet Technology SARL, qui travaille en étroite collaboration avec le groupe du CERCO développe des versions optimisées du logiciel de traitement d'images SpikeNet, spécifiquement adaptées au traitement temps-réel des images vidéo. La commercialisation d'une version capable d'analyser des scènes dynamiques sera la preuve la plus tangible de la réussite de ce projet. Mais en dehors de la valorisation de la recherche à travers des applications, nous visons surtout une meilleure compréhension des mécanismes de la vision dynamique.
Enfin, le quatrième participant est un laboratoire situé en Allemagne, dirigé par le Prof. Martin Giese. Ce chercheur a développé, avec Tomaso Poggio au MIT, un modèle neurobiologiquement plausible de la reconnaissance des mouvements biologiques ("biological motion"). Ce modèle est caractérisé par l'utilisation de deux voies de traitement en parallèle, l'une traitant les formes, l'autre basée sur une analyse des mouvements plus simples liée au flux optique. Un des objectifs de ces projets est de produire de relier ce type d'architecture aux développements précédents.
ensavoir plus ..



Partenaires du projet
Centre de Recherche Cerveau & Cognition
    UMR 5549
    Faculté de Médecine de Rangueil
    Université Paul Sabatier
    133, route de Narbonne, 31062, Toulouse

Projet ODYSSEE,
    INRIA- Sophia Antipolis
    2004 route des Lucioles,
    B.P. 93, 06902 Sophia-Antipolis Cedex

SpikeNet Technology SARL
    SEM Forum d'Entreprises
    Ave. de Castelnaudary
    31250 Revel
Laboratory for Action, Representation and Learning
Dept. Cognitive Neurology and Max Planck Institut for Biological Cybernetics
Spemannstr. 34
D-72076 Tuebingen  Allemagne
L'équipe du CERCO utilise ses connaissances dans le domaine de la vision biologique et des réseaux de neurones impulsionnels et asynchrones pour développer de nouvelles versions de leur noyau SpikeNet capable d'analyser des séquences d'images.
Ceci implique entre-autre l'intégration d'une approche basée sur l'analyse du flux optique. Pour cette deuxième option, on cherche à s'inspirer des algorithmes déjà développés en vision par machine, en étroite collaboration avec l'équipe de l'INRIA.
L'équipe de l'INRIA poursuit son analyse des algorithmes de réseaux de neurones impulsionnels développés au CERCO afin d'apporter les éléments théoriques indispensables à la pérénité du modèle actuel, ceci dans le cas de l'analyse de mouvements visuels. 
D'autre part, elle cherche à confronter ces algorithmes  d'inspiration biologique aux meilleurs outils mathématiques de vision algorithmique et à expérimenter ces modèles sur des données utilisées en psychophysque ou neurophysiologie.
Le rôle essentiel de la société SpikeNet Technology est la valorisation des résultats de ces recherches sur les réseaux de neurones asynchrones et impulsionnels, en commercialisant des nouvelles versions du noyau SpikeNet adapté à l'analyse des séquences d'images pour des applications industrielles bien définies. Ce groupe a développé un modèle neurobiologique de l'analyse des mouvements biologiques. Il se propose de travailler en collaboration avec Simon Thorpe et son équipe pour développer une version "SpikeNet" de son modèle. De plus, il apporterait son expertise considérable dans le domaine de la perception biologique du mouvement.



Principaux résultats obtenus.
Le modèle neuronal étudié ici avait ceci d'extrêmement intéressant dans le cadre de ces études qu'il ne se contente pas de se développer à partir d'une variable "abstraite'' liée à une quelconque "activité cérébrale'' (par  exemple sa fréquence moyenne de décharge), mais, au contraire, il prend le risque de rendre compte du comportement électro-physiologique réel du neurone  "spike par spike''. C'est ce lien fort entre la nature physique du signal et l'algorithmique sous-jacente qui a motivé fortement l'INRIA. 

Le CERCO a pu, dans le cadre de ce projet, améliorer l' algorithme initial.
Un nouvel algorithme de reconnaissance encore plus simple et efficace.
Les deux algorithmes candidats pour expliquer ce mécanisme cérébral utilisent l'ordre dans lequel les neurones déchargent, et font tous les deux appel au fait que ces les neurones les plus activés qui déchargent en premier. Or, les deux algorithmes diffèrent dans leur implémentation précise. L'algorithme original proposé par (Thorpe et Gautrais, 1997, 1998) utilise l'ordre précis dans lequel les neurones déchargent, alors que la nouvelle algorithme ne prend en compte que l'identité des premiers neurones à décharger, et non pas leur ordre exacte.
Il semblerait que dans de nombreux cas, il n'est pas du tout nécessaire d'utiliser l'ordre d'activation de toutes les entrées. En effet, lorsque le nombre d'entrées est important (ce qui est habituellement le cas dans des problèmes de traitement visuel), il suffit de prendre en compte juste les quelques pourcents de neurones qui déchargent en premier car la nombre de combinaisons possibles et déjà suffisamment riche pour obtenir une représentation satisfaisante. Prenons, par exemple, un neurone qui reçoit 100 entrées. Supposons que lorsqu'un stimulus est présenté, seul 10% de ces neurones en entrée peuvent décharger. Le nombre total de combinaisons de 10 neurones actifs parmi 100 est égale à 10C100, ce qui vaux 1.73 * 1013, un chiffre presque équivalent au nombre d'ordres d'activation  différent que l'on peut obtenir avec 8 neurones.
Ainsi, alors que l'algorithme original utilise l'ordre de décharge de toutes les entrées pour encoder un stimulus, notre nouvel algorithme n'utilise qu'un pourcentage fixe des entrées, ce qui simplifie beaucoup le problème. De plus, alors que l'algorithme original utilise l'ordre précis d'activation des neurones, la nouvelle version ne s'intéresse qu'à l'identité des neurones qui décharge rapidement, et non pas l'ordre d'activation précis.
Il existe une autre raison pour s'intéresser à ce nouvel algorithme. Depuis un an, Rudy Guyonneau (étudiant en première année de thèse et financé par une bourse CIFRE) a travaillé avec Rufin VanRullen sur des règles d'apprentissage basé sur le concept de Spike-Time Dependent Plasticity (STDP). Selon ce type de modèle, la modification des poids synaptiques par l'apprentissage dépende spécifiquement de l'intervalle temporel entre l'activation d'une synapse pré-synaptique et la date d'un potentiel d'action dans le neurone post-synaptique. En gros, si un synapse est active dans la dizaine de millisecondes qui précèdent un spike, son poids est augmenté, alors que s'il son activation est produite dans la période juste après le spike, son poids décrémente. Guyonneau et VanRullen ont montré par une série de simulations informatique, qu'une telle règle produit une situation où tous les poids se concentrent sur les entrées qui déchargeaient en premier lors de la phase d'apprentissage. Ceci est exactement ce que l'on préconise avec le nouvel algorithme de reconnaissance que nous avons formulé pour SpikeNet. Il y a donc une convergence remarquable  entre les résultats de nos travaux de modélisation avec SpikeNet et notre analyse des implications des règles neurobiologiques de l'apprentissage.

L'équipe INRIA en étroite collaboration avec son partenaire CERCO a pu étudier les  propriétés formelles de ce type de modèle.
Complexité statistique et les conséquences algorithmiques qui en  découlent.
  En ce qui concerne le problème de la classification de données, il est connu que les classificateurs efficaces sont ceux qui prennent en compte un  nombre réduit de paramètres pertinents. Cela semble en contradiction  avec  les  modèles biologiquement plausibles, basés sur des réseaux de neurones,  qui ont  -de par leur définition- un très grand nombre de paramètres.
  Ici, nous proposions de résoudre ce paradoxe apparent en construisant  un lien  entre des modèles biologiquement plausibles et des classificateurs ayant une  faible dimension de Vapnik-Chernovenkis. Il est alors clairement apparu que  les modèles de Thorpe avaient des dimensions de Vapnik-Chernovenkis  réduites de  l'ordre de 100 à comparer à celle de réseaux de neurones dont la dimension  peut-être au carré de leur nombre de neurones, donc immense.
 Contrairement à l'usage usuel de réseaux à très grande échelle avec un  nombre  énorme de variables (avec assez de degrés de liberté on peut risquer de  faire  tout et . . n'importe quoi) le modèle de Thorpe contraint fortement  l'espace  d'état (quantification des variables et limitation du nombre de degrés de  liberté effectifs).
 Le modèle de Thorpe a ceci de particulier qu'il peut se mettre sous une  forme  équivalente simple où seul l'ordre des spikes et non pas leur délai en  milli-secondes caractérise l'état du système. Cette propriété a été  exploitée ici pour valider ces aspects et faire le lien avec les outils  théoriques cités.
 Ce résultat très théorique a aussi des conséquences pratiques très  importantes, car il a aussi permis de mettre en place un mécanisme  algorithmique prometteur: l'idée, finalement assez simple, est de  considérer  des classificateurs du plus proche voisin ``optimisés'', géométriquement  linéaires par morceaux de dimension minimale, en tant que  généralisation des  machines à vecteurs supports (support-vector machine), proposés par  Vapnik.
 Cela permet de résoudre le précédent dilemme à la fois au niveau  théorique et algorithmique, ainsi que de discuter la plausibilité  biologique  de tels mécanismes. Une expérimentation sur un petit logiciel interactif de  démonstration permet d'analyser les performances de ces mécanismes qui sont  aussi validés sur des problèmes réels utilisés sur d'autres classificateurs  existants. De plus, si dans les réseaux classiques à la Hopfield la stabilité est une  propriété connue et facile à établir, le nouveau modèle - lors de la phase  d'apprentissage - met en oeuvre des mécanismes itératifs qui n'avaient  aucune  raison ni de converger vers la solution souhaitée, ni même de converger  tout  court. Avec le cadre proposé, l'``apprentissage'' se formalise comme la  minimisation d'un critère dit de Guermeur, convexe, donc dont la minimisation  est mise en oeuvre de manière fiable et convergente, de fait.
 Ce mécanisme se présente comme une sorte de règle de Hebb dont la  plausibilité biologique est reconnue depuis quelques années.
Publications:
  • Viéville T., Crahay S, 2002, A deterministic biologically plausible classifier. (INRIA Research Report, 4489, Journal of Computational Neuroscience, (in review), Communication au  Computational Neuroscience Meeting, Elevier, in press).
  • Viéville T., 2003, SVM et modèle biologique de reconnaissance  visuelle, Journées thématique "Support Vector  Machines et méthodes ànoyau", ENST, Paris.
 


Perspectives : l' étape suivante
Le but de la seconde phase de ce projet est de développer une extension des travaux de Thorpe au cas de la reconnaissance d'objets dans des scènes dynamiques: elle se fera à partir de ces modèles ``variationels''  d'analyse du mouvement élaborés en vision artificielle.

Il s'agit de tester la validité du modèle de Thorpe appliquée aux opérateurs spatio-temporels du cortex visuel pour discriminer un ``objet dynamique'' (comme un geste de la main) à partir d'attributs de forme et de mouvement, par exemple des contours cinétiques.
La connaissance actuelle de l'organisation fonctionnelle du système visuel du primate donne, bien entendu, des pistes pour choisir ces  différents opérateurs, mais un travail coopératif entre les deux équipes  est nécessaire pour s'assurer à la fois que les opérateurs choisis sont biologiquement plausibles mais aussi que ces simulations des opérateurs neuronaux sont compatibles avec ce que nous savons aujourd'hui des problèmes théoriques liés à l'analyse du mouvement.
Ces modèles seront analysés en cohérence avec les modèles biologiques de calcul du mouvement, par exemple de Heeger, Grossberg ou de Giese et Poggio.
Plus précisément, nous testerons l'hypothèse selon laquelle le modèle de Thorpe peut  être appliquée à un flot d'information neuronale lors de la présentation  non pas d'une image isolée, mais d'une séquence de telles images.

Travail thérorique. Cette extension se fera à partir du travail de cette année: l'équipe de l'INRIA a déja effectuée une analyse poussée des algorithmes de réseaux de neurones impulsionnels développés au CERCO afin d'apporter les éléments théoriques indispensables à la pérénité du modèle actuel. Cette analyse mathématique est d'une grande importance pour le développement futur que nous visons, car cela permettra de confronter ces algorithmes d'inspiration biologique aux meilleurs outils mathématiques de vision algorithmique.
L'INRIA appliquera ces nouveaux algorithmes au problème de la reconnaisance du mouvement abordé ici. Une réflexion sur les liens entre les outils de vision artificiels et des opérateurs biologiquement  plausibles a déja été abordé (http://www-sop.inria.fr/rapports/sophia/RR-4625.html). Il comparera en particulier les résultats de ces modules avec ceux obtenus grâce aux travaux du Pr. Giese. Nous avons déja préparé ce volet du travail grâce au partenaire du Max-Planck Institute qui nous a fourni des données pour nous permettre de commencer à travailler et qui sont donc disponibles à l'INRIA.
Au niveau théorique l'INRIA analysera les mécanismes d'apprentissage dans les modèles de Thorpe (par exemple en considérant la variation des ``poids'' des neurones de sortie du modèle en lien avec le mécanisme Hébbien mis en place dans [Vieville & Crahay 2002]). De même le problème de l'optimisation  des modèles de Thorpe (nombre de neurones, connections) etc.. sera abordé à partir des mêmes résulats.

Travail expérimental.   Le modèle sera spécifié à partir des outils de NeuroML Model Description Methods for Collaborative Modelling in Neuroscience .
Au niveau des ressources de calcul, l'Inria-Sophia mettra à disposition du projet la ferme de PC de façon à répondre aux très gros  besoins en calcul liés à ce projet. Le centre de calcul de l'Inria-Sophia mettra à disposition ses ressources logicielles et de maintenance. Les développement logiciels coûteux en calcul se feront sur cet outil.
     D'autre part, nous chercherons à confronter ces algorithmes  d'inspiration biologique aux meilleurs outils mathématiques de vision algorithmique et à expérimenter ces modèles sur des données issues du langage des signes ou des stimulus utilisés par le CERCO et l'équipe 4 en psychophysque ou neurophysiologie.



version du 8 septembre 2003