Même si certains prototypes réalisent déjà certaines des tâches décrites dans la partie précédente, leur introduction généralisée à l'hôpital se heurte encore à de nombreux problèmes ouverts. On peut acquérir une bonne vision de l'état de l'art à partir du livre Computer Integrated Surgery publié récemment par Taylor, Lavallée, Burdea et Moesges [108], d'un article général de Pun, Gerig et Ratib [92], et de l'auteur du présent article [4].
Les revues scientifiques Medical Image Analysis (Oxford University
Press)
et Transactions on Medical Imaging (IEEE) sont de bonnes sources
de références.
Enfin, le lecteur néophyte dans le domaine de l'imagerie médicale sera intéressé par une présentation des techniques d'acquisition des principales modalités d'imagerie médicale, écrit par Acharya et al [1].
Pour présenter l'état de l'art en analyse des images médicales, il est pratique de regrouper un certain nombre de problèmes canoniques dans les classes suivantes : restauration, segmentation, recalage, morphométrie, mouvement, visualisation, simulation et robotique médicale. Ces différentes classes de problèmes sont maintenant présentées tour à tour.
La restauration d'images consiste à recréer une image améliorée, dans laquelle on a supprimé certains défauts liés au processus physique d'acquisition. Deux exemples classiques de restauration d'images sont la correction du biais et la réduction du bruit.
Les images IRM sont souvent corrompues par un biais multiplicatif qu'il convient de supprimer pour que des tissus anatomiques similaires présentent une intensité constante (par exemple pour que la matière blanche conserve une intensité unique en tout point du cerveau). Il existe des méthodes permettant de corriger le biais de l'image, tout en réalisant une classification des points de l'image selon le milieu auquel ils appartiennent. Dans cet esprit, l'algorithme EM (``expectation-maximisation'') est une approche itérative dans laquelle, à partir d'une classification initiale, on optimise successivement le calcul du biais puis une nouvelle classification [118]. Une autre approche pour la correction du gain est présentée par [47].
Il existe de très nombreuses méthodes pour réduire le bruit lié à l'acquisition des images. Les techniques de filtrage linéaire appliquent des filtres passe-bas qui tout en réduisant le bruit dans l'image tendent à lisser les contours, ce qui rend l'image floue. Par contre, les techniques de diffusion anisotrope sont très efficaces pour lisser l'image tout en préservant les discontinuités importantes, et produisent des résultats remarquables. La diffusion anisotrope en trois dimensions est utilisée par exemple dans les références suivantes : [41,38,83,60].
La segmentation consiste à extraire des points, des lignes ou des régions, qui sont ensuite utilisées comme des données dans une tâche complémentaire comme le recalage, la mesure, l'analyse du mouvement, la visualisation, etc. Une introduction sur ce sujet a été récemment publiée [5]. Il n'y a pas de solution générale au problème de la segmentation, mais plutôt un ensemble d'outils mathématiques et algorithmiques que l'on peut combiner ensemble pour résoudre des problèmes spécifiques. Nous citons quelques uns de ces outils ci-dessous.
Des opérateurs différentiels plus complexes permettent de calculer localement des lignes de crêtes sur des surfaces d'iso-intensité. Les lignes de crêtes correspondent à des extrémalités de la courbure principale maximale, et correspondent intuitivement aux endroits où la surface tourne le plus rapidement. Les lignes de crètes peuvent être définies de manière implicite à l'intersection de deux iso-surfaces et extraites par l'algorithme des ``marching lines'' très efficacement, ainsi que l'ont montré Thirion et Gourdon [111].
On peut raffiner l'analyse en ne conservant sur ces lignes que les points extrémaux, qui correspondent à une seconde extrémalité différentielle. Comme ces lignes et ces points sont invariants par rotation et translation, ils peuvent être utilisés pour des tâches de recalage rigide. Des références récentes incluent [55,109,32,80] (mais il faut également se reporter à la partie recalage ci-dessous). Une analyse de l'extraction multi-échelle des singularités différentielles a été faite par Fidrich dans [37].
Le recalage est un problème commun à de nombreuses des tâches d'analyse des images médicales décrites dans la première partie de cet article. En effet, le recalage est nécessaire pour comparer des images acquises sur un même patient à des instants différents ou bien avec des modalités différentes. Il peut s'agir dans ce cas de recalage rigide ou non-rigide. Le recalage est également nécessaire lorsque l'on souhaite comparer des images de patients différents. Il s'agit alors toujours de recalage non-rigide. Un état de l'art sur le recalage rigide a été publié par van den Elsen [116] et par Lavallée [64]. Une comparaison entre plusieurs approches a été réalisée récemment par J. West et al [119]. On trouvera de nombreuses références sur le sujet dans ces trois publications.
Le recalage rigide consiste à rechercher une rotation et une translation (6 paramètres en tout) permettant de superposer au mieux l'une des images à recaler (appelée le modèle) sur la seconde (appelée la scène). La difficulté du problème est différente selon que l'on s'intéresse à des images provenant de la même modalité (recalage monomodal) ou bien de modalités différentes (recalage multimodal). Certaines méthodes de recalage rigide monomodal s'appuient sur les lignes de crêtes ou les points extrémaux décrits précédemment et obtenus lors d'une étape préalable de segmentation [55,109,115,45,89,46]. Ces méthodes ne sont généralement pas utilisables dans le cas du recalage multimodal. Dans ce cas, d'autres approches utilisent la minimisation d'un critère de distance ou de corrélation statistique entre les images [102,70,44,120,56,86]. Récemment, plusieurs auteurs ont montré que l'information mutuelle était un critère puissant pour recaler des images multimodales sans segmentation préalable [117,69,52]. Roche et al a montré que dans certains cas, une métrique fondée sur le rappport de correlation entre deux images était plus robuste que l'information mutuelle [94].
Enfin, le recalage rigide peut être recherché entre une image volumique et une image projective 2-D, par exemple pour superposer une angiographie pre-opératoire 3-D par résonance magnétique avec une angiographie per-opératoire 2-D par rayons X, ou pour d'autres applications en réalité virtuelle ou en réalité augmentée [44,35,65,39,17,40].
Le recalage non-rigide est un problème plus difficile, puisque le nombre de paramètres recherchés peut être beaucoup plus important que dans le cas du recalage rigide. On peut ainsi passer de 6 paramètres pour les transformations rigides à 12 pour les transformations affines les plus générales, et davantage encore pour les transformations polynomiales d'ordre supérieur. Certaines approches s'appuient sur l'extraction d'invariants géométriques pour la classe des transformations géométriques choisie [107,28,27,34,36]. D'autres méthodes s'appuient directement sur les intensités des points de l'image [14,110,13].
La morphométrie consiste à étudier la géométrie des formes, et en particulier le calcul de formes moyennes et de variations autour de ces formes.
La définition de statistiques sur des formes requiert un formalisme adapté, car celles-ci s'appliquent généralement sur des variétés différentielles qui ne sont pas des espaces vectoriels (par exemple les droites, les plans, les repères, les points orientés, les rotations spatiales, etc). Le lecteur intéressé pourra se reporter à l'excellent ouvrage de C. Small [100] qui présente de manière unifié les travaux précurseurs de Kendall et Bookstein. Il pourra également se référer au travail de Pennec [87,88] pour des prolongements importants en trois dimensions.
Les applications concernent le calcul d'atlas anatomiques probabilistes, et la comparaison d'images entre patients. On pourra se reporter aux travaux de Thompson et Toga [114], A. Evans et al [33], Bookstein[11], Dean et al [25], Davatzikos et al [24], Subsol et al[105,104], Mangin et al [71], Martin et al, [72,73], Cootes et al [18], Székely et al [106], Andreasen et al [3].
Le projet européen Biomorph, financé par le programme BIOMED-2 de la communauté européenne, développe actuellement des outils morphométriques pour étudier la forme et la dissymétrie de certaines structures cérébrales, en particulier chez des patients schizophrènes, ainsi que la mesure automatique de l'évolution de lésions chez des patients souffrant de sclérose en plaques [16,112,113].
On doit également noter les travaux concernant la construction d'atlas anatomiques [53,84], ainsi que la recherche d'images ``similaires'' à une image donnée dans des bases de données d'images volumiques [48].
L'analyse du mouvement dans des séquences d'images dynamiques est un sujet difficile, car les données sont en 4 dimensions (trois dimensions spatiales, une dimension temporelle).
L'analyse d'images peut fournir un champ vectoriel décrivant le déplacement de chaque point entre deux images successives. On peut également rechercher une représentation plus globale du mouvement, en utilisant un modèle dynamique décrit par un petit nombre de paramètres quantitatifs.
Pour retrouver un déplacement entre deux images successives, on peut utiliser les modèles déformables cités dans la partie segmentation [75], ou bien des méthodes qui s'appuient sur des attributs différentiels calculés dans les images, comme les contours, ou les points de forte courbure [63,2,9,43].
Certaines images bénéficient d'un marquage physique de lignes et de points : c'est le cas de l'IRM marquée ou ``tagged MRI'', dans laquelle on magnétise de manière différente certains tissus selon un motif géométrique régulier (typiquement une grille spatiale). Cette grille est visible dans la première image, et on peut suivre sa déformation dans les images suivantes. Dans le cas de l'IRM à contraste de phase, c'est une estimation locale de la vitesse de déplacement qui est fournie en chaque point et à chaque instant. Les principes physiques de l'IRM marquée sont décrits de manière pédagogique dans [76]. Des méthodes pour retrouver le mouvement des points de l'IRM marquée est présentée dans [59,49], et son extrapolation à l'ensemble de l'image est présentée dans [93,31]. L'exploitation des images IRM à contraste de phase est décrite dans [79,74].
On trouvera une analyse globale du mouvement par décomposition modale dans [82,54], à partir de modèles paramétriques déformables dans [85,6], et en utilisant un modèle déformable continu en quatre dimensions dans [26]. D'autres approches sont décrites dans [121,77,99].
Historiquement, la visualisation des images volumiques a été le sujet de recherche le plus actif dans le domaine du traitement informatique des images médicales 3-D. Gabor Herman a publié un état de l'art sur le sujet [51], que l'on peut compléter par une revue des principaux algorithmes et systèmes de visualisation publié par Stytz et al [103].
En général, la visualisation requiert une étape préliminaire de segmentation (cf. partie précédente). Une illustration spectaculaire de l'état de l'art incluant un rendu volumique des données du ``Visible Man'' est présentée par l'équipe de Hoehne dans [97].
La recherche dans ce domaine s'applique à définir des modèles géométriques et biomécaniques des organes et des tissus mous pour simuler en temps réel leur déformation, découpe ou suture. Les contraintes du temps réel impliquent la synthèse des images à la cadence de 24 Hz, et le calcul des forces appliquées en retour sur les instruments chirurgicaux à la cadence de plusieurs centaines de Hertz (typiquement 300 Hz).
Beaucoup de travaux s'appuient sur des modèles de type masses-ressorts, car ils permettent une implémentation relativement simple, et des temps de calcul raisonnables [8,78,62]. Dans le laboratoire MERL de Mitsubishi Electric à Boston, Gibson [42] prend en compte la nature volumique des organes avec une loi de déformation qui est dérivée d'un modèle de type masses-ressorts. Cover [22] a développé un modèle de plaques minces pour simuler la chirurgie de la vésicule billiaire.
Les éléments finis permettent de modéliser plus finement les
propriétés biomécaniques des tissus mous. Ils sont moins couramment utilisés, car leur
implémentation est plus complexe, et leur utilisation plus coûteuse
en temps de calcul. Néanmoins [96] a proposé une méthode
pour simuler de manière réaliste la déformation volumique de l'il
en utilisant un modèle de matériaux élastique 3-D incompressible.
Un autre exemple de simulation de la chirurgie de l'oeil est donné
par [66]. Les solutions proposées dans ces travaux sont
très éloignées d'applications en temps-réel.
D'autres approches sont décrites dans les références suivantes :
[12,101,90].Un état de l'art sur la modélisation des tissus mous a
été publié par H. Delingette [30].
Dans l'équipe Epidaure de l'INRIA, S. Cotin et H. Delingette ont introduit une approche qui permet de déformer un objet volumique élastique linéaire et de calculer les forces perçues en retour en temps réel. Ceci est rendu possible par le calcul préalable de déformations élémentaires qui sont stockées une fois pour toutes pour un organe donné [21,19]. Ce modèle a été raffiné pour introduire des non-linéarités permettant de mieux approximer le comportement biomécanique de certains tissus mous [20]. Ce travail est actuellement prolongé dans le cadre d'une action incitative regroupant cinq équipes de l'INRIA spécialisées respectivement en analyse et synthèse d'images, calcul scientifique, biomécanique et robotique, sur le thème ``modélisation d'organes pour la simulation de chirurgie''. On pourra consulter le site internet suivant pour plus de détails : http://www.inria.fr/epidaure/AISIM/aisim.html.