curité et Surveillance
dans les Flots de Données

 

 

 

 

 

 

 

 

 

Accueil

Contexte

Problématique

Propositions

Applications

Equipes

Positionnement

Bibliographie

 

Réunions et CR

Equipe AxIS
INRIA
Sophia Antipolis

Equipe Dream
IRISA
Rennes

Equipe KDD
LGI2P/EMA
Nîmes

Equipe TATOO
LIRMM
Montpellier

 

Surveillance et diagnostic par reconnaissance de motifs

Nous nous intéressons particulièrement à la surveillance et au diagnostic par reconnaissance de comportements caractéristiques du système observé. Cette technique fait partie des méthodes dites à base de modèle. Dans ce cas le modèle ne décrit pas de manière abstraite le fonctionnement du système mais fournit une description des différents comportements normaux ou anormaux du système. Dans le cas idéal les descriptions permettent de discriminer les différents états dans lequel peut se trouver le système.

La technique de surveillance varie selon que les comportements mémorisés dans le modèle sont normaux ou anormaux. Dans le premier cas il s'agit de vérifier qu'un ensemble d'indicateurs conservent des valeurs acceptables ou que des séquences d'événements indicatrices de bon fonctionnement se produisent à intervalles réguliers. Dans le second cas il s'agit principalement de reconnaître dans les données d'observation du système des motifs d'événements (des motifs séquentiels ou des chroniques) ou des ensembles de valeurs caractéristiques indiquant qu'une panne s'est produite. Dans ce cas une alarme est émise à l'attention de l'opérateur qui peut prendre les décisions de conduite qui s'imposent.

Dans la plupart des cas, de tels modèles doivent être construits de manière automatique du fait de leur complexité et de la nécessité de mises à jour régulières. Les techniques utilisées sont issues de l'apprentissage automatique ou de la fouille de données. L'extraction de séquences permet d'aquérir des chroniques ou des motifs significatifs selon divers critères liés à des contraintes temporelles ou d'apparition, par exemple. La différence essentielle entre les motifs et les chroniques est liée aux données manipulées. Dans le cas des chroniques, les données sont plus généralement issues de capteurs et se présentent sous la forme d'une longue séquence d'événements ininterrompue (e.g. des données d'électrocardiogramme issus d'un patient, ou des séquences de capteurs dans un contexte de supervision). Les motifs séquentiels, quant à eux, sont recherchés sur un très grand nombre de séquences qui sont bien plus courtes (e.g. les sessions de navigation des utilisateurs sur le mail, les traces d'accès à un serveur).

D'un point de vue conceptuel, cette méthode est proche du traitement de requêtes à des bases de données sur des flots (méthode push). Toutefois dans ces approches l'ensemble des requêtes (les motifs servant à interroger le flot) est fixe et l'accent est mis sur l'efficacité du processus d'interrogation ``à la volée''. Nous nous intéressons ici à la manière d'apprendre et de faire évoluer un tel ensemble de requêtes.