Reconnaissance assistée par ordinateur d'arbres et de forêts

sur images numériques à haute ou très haute résolution

1. Objectifs


Les nouvelles données numériques de télédétection à haute ou très haute résolution -THR, c'est à dire dans ce document à résolution métrique ou sub-métrique - ouvrent des perspectives nouvelles dans la connaissance des arbres et des forêts, et doivent permettre de répondre à des besoins que les satellites d'observation de la Terre à résolution décamétrique (SPOT panchromatique par exemple) ou pluri-décamétrique (LANDSAT ou SPOT multispectral par exemple) opérationnels depuis bientôt 30 ans n'ont pas été capables de satisfaire.

      Contexte socio-économique: un besoin d'information plus détaillée


      Les besoins d'information comprennent aussi bien des besoins généraux de gestiondes forêts, que des besoins plus particuliers comme celui de cartographier les types de peuplements en forêt de montagne. Ces données pourraient aussi servir à évaluer certains paramètres de la biodiversité en fournissant des informations plus précises sur des arbres et leur situation (isolés, en rangées, en bosquets ou en peuplements) dans les paysages européens, ou à mieux évaluer le reboisement se produisant dans les secteurs sujets à l'abandon de terre, anciens pâturages ou terres agricoles moins productives en zones défavorisées, ou encore en zones péri-urbaines.

      Dans ce contexte, un outil pour aider les forestiers, les gestionnaires du territoire, les écologues du paysage dans l'inventaire des arbres isolés et en alignement, en bosquet ou en forêt serait bienvenu. Si cet outil pouvait aussi servir à estimer d'autres paramètres, tels que densité, taux de couvert, taille et diamètre des arbres, jusqu'à présent renseignés uniquement par des travaux sur le terrain, cela s'avérerait fortement utile du point de vue économique.

      Contexte technologique: 3 sources d'images de haute résolution


      Jusque récemment, la grande majorité des images de télédétection qui ont été traitées numériquement étaient des images satellites à résolution pluri-décamétriques ou parfois pluri-métriques. Ces images ont des résolutions de 30m (Landsat ETM), de 20m (SPOT XS), de 15m (Landsat Pan), de 10m (SPOT Pan) ou de 5.8m (IRS-1D), mais ces dernières avec un codage sur 6 bits seulement, au lieu de 8 pour les autres satellites. Elles ont été préférentiellement classifiées pixel -à -pixel, et les pixels classifiés pouvaient plus tard être regroupés, généralement sur des critères d'homogénéité. Les objets alors identifiés (champs, forêts, surfaces en eau...) ont donc eu des dimensions de plusieurs dizaines à plusieurs centaines de mètres. Les arbres isolés et les arbres dans les haies, ou bosquets n'ont pas pu être correctement étudiés. Pour les forêts fermées, la description de leur structure (densité, espacement) n'était pas accessible.

      Mais le contexte technologique de l'imagerie à haute résolution évolue rapidement selon deux lignes convergentes, d'un côté stockage de données et traitement, et de l'autre disponibilité de données. Ces capacités de stockage et de traitement permettent maintenant d'envisager l'acquisition et le traitement des données THR. En fait, 3 sources différentes pourront produire de telles données. La première viendrait du scannage de photographies aériennes analogiques. Ces données représentent la mémoire des paysages et seraient très utiles pour l'étude des évolutions diachroniques. Une deuxième source viendrait de caméras numériques, équipées de matrices CCD de 3,000x2,000-pixel ou 4,000x4,000-pixel, expérimentales ou même déjà opérationnelles en Europe (à l'IGN par exemple). Comparées aux photographies aériennes analogiques, ces caméras (au sens de chambres photographiques) offrent les avantages d'une solution entièrement numérique, de plus avec une qualité radiométrique améliorée, car les images sont codées sur 11 ou 12 bits. Une troisième source d'images numériques de résolution d'un mètre a juste atteint le marché: celles acquises par les satellites à haute résolution. Le premier lancement réussi s'est produit en septembre 1999, mettant en orbite le satellite IKONOS 2. Un second, QuickBird, a été lancé avec succès en octobre 2001, avec une résolution améliorée de 61 centimètres. De nouveaux satellites ont  été lancés en 2002, comme SPOT5  (2,5m en Pan supermode). Ces satellites offrent une qualité radiométrique améliorée, avec un codage sur 11- ou 12 -bits. Cependant leur qualité devrait être inférieure à celle des caméras numériques aériennes du fait que le signal doit traverser une plus grande épaisseur d'atmosphère.
       

      Objectifs à long terme

                            L'objectif général de notre collaboration avec le Cemagref et l'IFN est de réaliser l'identification assistée par ordinateur et le géoréférencement d'arbres isolés, en rangées ou en peuplements forestiers, sur des images numériques à haute ou très haute résolution

L'objectif doit être atteint avec différentes espèces d'arbre (bouleaux, chênes, pins, sapins, épicéas...), avec différentes formes de couronne; et avec des conditions variables d'illumination, selon la pente et l'exposition.

Les objectifs particuliers du projet sont:

           Objectifs de cette COLORS

               Dans ce cadre, nous proposons d'initialiser une collaboration avec le Cemagref pour étudier la faisabilité de l'approche par processus ponctuels marqués pour résoudre ce problème.  La durée totale prévue est de un an, en s'appuyant essentiellement sur un stage de DEA d'une durée de six mois. L'objectif sera de définir et développer un premier modèle de processus ponctuels marqués  pour extraire les houppiers (volume du feuillage sans le tronc à la base). Les premiers tests de validation seront menés sur des images fournies par le Cemagref. A l'issue de ce projet, nous devrions être en mesure de fournir de premiers résultats ainsi que de conclure sur la capacité de la méthode proposée, les processus ponctuels marqués,  à résoudre le problème. Suivant les résultats obtenus, nous envisageons de poursuivre cette collaboration dans un cadre plus vaste de type projet européen.

à gauche,morceau de forêt (avec houppiers joints) et à droite, morceau de peupleraie

2. Méthodologie

 

2.1 Méthodes existantes


Même si aucune méthode n'est totalement satisfaisante à ce jour en ce qui concerne la détection de houppiers, un certain nombre de travaux fournissent un cadre préliminaire. Un premier type de méthodes consiste à détecter les maxima locaux spectraux. Un algorithme de suivi de vallées permet alors de délimiter les zones d'influence de ces maxima. Chaque zone est alors assimilée à un houppier. Ce genre de technique est adapté aux milieux denses et repose sur une hypothèse d'unicité d'un maximum local par houppier. On peut distinguer ensuite les approches fondées sur une analyse de la texture (un paramètre discriminant est proposé pour caractériser les houppiers). Dans les milieux denses, ces approches ont tendance à fusionner les houppiers proches les uns des autres. En outre, la précision géométrique de la délimitation des houppiers reste faible. Pour finir, des approches considèrent à la fois un modèle radiométrique et un modèle géométrique (en anglais " template ") des houppiers et font l'extraction par un algorithme de type mise en correspondance. Ce type d'approche semble plus robuste car elle utilise deux types d'information complémentaires. En revanche, aucune information sur la répartition spatiale et les interactions entre houppiers n'est prise en compte. Nous proposons de nous inscrire dans ce type d'approches tout en intégrant les informations manquantes. Ceci peut être réalisé par une modélisation par processus ponctuels marqués.
 
 
 

2.2 Processus ponctuels marqués


Les processus ponctuels marqués permettent de tirer profit à la fois des méthodes stochastiques et des approches géométriques. En effet, les modèles aléatoires, notamment les champs de Markov, ont fait leurs preuves en analyse d'image par leur capacités à prendre en compte le bruit et des informations a priori sur la structure de l'image ou des objets recherchés. Néanmoins, le type d'information a priori traitée reste limité dans ces approches le plus souvent pixéliques. Si des critères d'homogénéité sont facilement modélisables, il est plus difficile d'injecter des informations sur la géométrie de la solution. En outre, le terme d'attache aux données, calculé au niveau du pixel, résiste mal à un bruit corrélé ou de type géométrique. Une première solution consiste à définir des modèles sur graphe. Cela implique néanmoins de définir le graphe dans une première étape, donc d'avoir de fortes connaissances sur le nombre d'objets, leur répartition dans la scène et leur relations. Les processus ponctuels objet offrent un contexte beaucoup plus flexible à cet égard. Les réalisations d'un tel processus sont constituées d'un ensemble de points dont la répartition est induite par une densité relativement à la mesure de Poisson. Cette densité permet de modéliser le nombre moyen de points ainsi que des relations entre ces points (proximité, alignement,...). A chacun de ces points sont associées des marques, réalisations de variables aléatoires, définissant la géométrie d'un objet sous-jacent (rayon, longueur, épaisseur,...). Ce type de modèle, d'une utilisation récente en analyse d'image, est étudié au sein du projet Ariana depuis quelques années. Des premiers résultats intéressants ont été obtenus tant pour l'extraction d'items cartographiques (routes, bâtiments) que pour la segmentation d'images.
 
 

2.3 Programme de recherche

Le problème traité dans cette COLORS est bien adapté à une modélisation par processus ponctuel marqué. En effet, la notion d'objet est prépondérante puisque un des buts du projet est de compter les arbres. D'autre part, les paramètres des objets permettront de caractériser, voire de reconnaître, les différents arbres. Nous définirons donc un objet géométrique pour modéliser le houppier des arbres. Dans un premier temps, nous considérerons une prise de vue et un dénivelé conduisant à des processus de disques. Nous étudierons ensuite différentes déformations de cet objet de référence en fonction des paramètres de prise de vue et de la configuration du terrain. Différentes informations a priori sur la répartition spatiale des arbres, fournies par le Cemagref, nous permettrons de définir les interactions entre les objets. En ce qui concerne le terme d'attache aux données, nous étudierons plusieurs paramètres de texture.

Une fois le modèle défini, son utilisation nécessitera la mise au point d'un algorithme d'optimisation. La difficulté associée aux processus ponctuels marqués réside dans le caractère aléatoire du nombre de variables puisque le nombre d'objets n'est pas connu a priori. Ceci signifie que deux configurations ayant un nombre d'objets différent ont une dimension différente. Par ailleurs, le modèle n'est défini qu'à une constante multiplicative près car la fonction de partition (ou constante de normalisation) n'est pas calculable analytiquement. Dès lors, les méthodes de simulation directe ne sont pas adaptées. Pour résoudre ce problème, nous pouvons utiliser des processus de naissance et mort, des processus de saut et diffusion ou alors des approches MCMC (simulation de Monte Carlo par Chaînes de Markov) à sauts réversibles. Ce dernier type de méthodes est plus flexible et bien adapté aux modèles issus de l'analyse d'image. Une fois le modèle développé, nous nous attacherons donc à définir un algorithme MCMC à sauts réversibles pour l'optimiser. Cet algorithme est itératif. A chaque itération, une perturbation aléatoire de la configuration courante est proposée. La nouvelle configuration obtenue est acceptée avec une probabilité qui dépend du modèle, évalué pour la configuration courante et pour la nouvelle configuration, ainsi que de la loi de proposition. Les différentes perturbations proposées consistent typiquement en l'ajout ou la suppression (naissance ou mort) d'un objet dans la configuration courante ou encore en la modification de la marque ou de la position d'un objet de la configuration courante. Les différentes perturbations proposées ainsi que la manière de les combiner ont une influence primordiale sur les propriétés de convergence. En effet, si la convergence est assurée théoriquement, la vitesse de convergence reste un problème ouvert. Un effort important sera donc consacré à la définition d'un algorithme d'optimisation adapté au problème et au modèle considéré.

Nous définirons un estimateur et un algorithme convergeant vers cet estimateur pour extraire les houppiers à partir d'une scène. Nous aurons alors directement accès au nombre d'arbres (nombre d'objets). Les statistiques de la configuration obtenue permettront également de récupérer des informations précieuses sur le couvert forestier comme la densité du boisement, la répartition spatiale des arbres ou encore la distribution de leur taille. En outre, nous aborderons dans un second temps la classification des houppiers détectés en fonction de l'espèce.
 
 
 

2.4. Références :


Couteron P., Deshayes M & Roches C., 2001. A flexible approach for woody cover assessment from SPOT HRV XS data in semi-arid West Africa. Application in northern Burkina Faso, Int. Journal of Remote Sensing, 22-6, 1029-1051.

Descombes X. ,  Zerubia J. (2002). Marked Point Processes in Image Analysis. IEEE Signal Processing Magazine, vol. 19, no. 5, pp.77-84.

Descombes, X., R. Stoica, L. Garcin, J. Zerubia (2001). A RJMCMC Algorithm for Object Processes in Image Processing. Monte Carlo Methods and Applications, Vol. 7, No. 1-2, pp. 149-156.

Descombes, X., S. Drot, M. Imberty, H. Le Men, J. Zerubia (2001). Segmentation d'image haute résolution par processus Markov objet. Séminaire Télédétection à très haute résolution spatiale et analyse d'image. Montpellier, 14 décembre 1999, pp. 63-72, Cemagref Edition.

Deshayes M., 1997. Typologies et cartographies des milieux forestiers européens : possibilités et limites de la télédétection satellitale. In Actes des rencontres internationales La Cartographie pour la Gestion des Milieux Naturels, Saint-Étienne, 13-15 novembre 1995, Cemagref-ATEN-CRENAM, 177-189.
 

Equipes :

Ariana (projet commun INRIA/CNRS/UNSA, Sophia Antipolis) : le rôle du projet Ariana sera d'apporter son expertise sur les méthodes stochastiques pour l'analyse d'image et tout particulièrement pour les applications en télédétection. Ariana s'est notamment orienté depuis quelques années vers l'étude des processus ponctuels marqués pour l'extraction d'item cartographique. L'extraction de houppiers sera donc une application supplémentaire de ces modèles. Participants :

                        Josiane Zerubia (DR1 INRIA - responsable du projet Ariana)
                       Xavier Descombes (CR1 INRIA- responsable de cette COLORS)

 
Cemagref (Montpellier) : le Cemagref apportera son expérience dans l'étude des milieux forestiers. Son action consistera à aider à la définition d'un modèle géométrique des houppiers et des interactions entre houppiers. En outre, le Cemagref validera les résultats obtenus.

            Participants :

                                        Michel Deshayes (ICGREF, Ingénieur en Chef du Génie Rural, des Eaux et des Forêts, enseignant-chercheur, animateur du Thème de Recherche Géosystèmes)
                                        Pierre Couteron (ITEF, Ingénieur des Travaux des Eaux et des Forêts, enseignant-chercheur).

IFN (Lattes, Montpellier) : L'IFN apportera sa connaissance du milieu forestier. Son rôle sera prédominant pour la phase d'évaluation.

        Participants :

                                        Jean-Guy Boureau (Ingénieur chargé des études et recherche en télédétection).
                                        Nicolas Stach (Ingénieur chargé des études et recherche en télédétection).
 
 

Budget demandé :

1 stagiaire sur 6 mois : 10000 euros

1 Conférence internationale : 2300 euros

4 missions Nice-Montpellier (2 x 2 personnes) : 900 euros

1 mission Montpellier-Nice : 400 euros

1 Séjour de 15 jours à Montpellier pour le stagiaire : 1400 euros

Soit au total : 15000 euros sur 12 mois