curité et Surveillance
dans les Flots de Données

 

 

 

 

 

 

 

 

 

Accueil

Contexte

Problématique

Propositions

Applications

Equipes

Positionnement

Bibliographie

 

Réunions et CR

Equipe AxIS
INRIA
Sophia Antipolis

Equipe Dream
IRISA
Rennes

Equipe KDD
LGI2P/EMA
Nîmes

Equipe TATOO
LIRMM
Montpellier

 

 

L'objectif de l'ARC SÉSUR est de réunir les compétences (conceptuelles et expérimentales) indispensables à l'étude de solutions efficaces pour sécuriser, surveiller et diagnostiquer les systèmes producteurs de données connues sous le nom de ``flots de données'' ou ``data streams''. Ces données présentent deux caractéristiques majeures : 1) elles sont les signes vitaux du système considéré et leur analyse est dans la plupart des cas une nécessité première et 2) elles sont produites à une vitesse et dans des quantités telles que la technologie actuelle ne permet pas de les traiter de façon satisfaisante.
Nous nous intéressons particulièrement à la surveillance de systèmes produisant des flots de données. La surveillance consiste dans ce cas à détecter dans ce flot de données des motifs caractéristiques du bon ou du mauvais fonctionnement du système. Jusqu'à présent de telles méthodes n'utilisaient que des ensembles de motifs fixés ou appris au préalable. Toutefois le cadre général des flots de données impose d'extraire et de détecter simultanément et ``à la volée'' les motifs synoymes de dysfonctionnement. Cette détection peut alors être le résultat de méthodes supervisées ou non supervisées.

Nous avons donc identifié deux thèmes à explorer dans le cadre de l'ARC SÉSUR :

  1. Définir de nouvelles techniques d'extraction de connaissances capables de prendre en compte les caractéristiques nouvelles de ces données. Cela demande de revisiter l'ensemble des techniques existantes. Dans cette ARC, notre objectif sera d'étudier l'extraction de deux types de motifs temporels dans les flots de données : les motifs séquentiels et les chroniques qui sont des motifs contenant des événements non séquentiels mais reliés par des contraintes.
  2. Proposer des solutions pour assurer la gestion et la maintenance de ces connaissances au fil du temps. En effet, compte tenu de la nature extrêmement dynamique des flots de données il est évident que l'évolution des connaissances extraites sera un défi pour ce projet. Notre objectif dans l'ARC SÉSUR est de proposer des méthodes de gestion des connaissances acquises sur le flot, en se basant sur des travaux préliminaires existants dans ce domaine chez les équipes concernées.

La pertinence et l'utilité de ces connaissances à des fins de sécurité, de surveillance et de diagnostic dans les systèmes ciblés sera également privilégiée. Dans ce but, les différents contextes applicatifs des partenaires impliqués dans cette proposition seront étudiés. Nous garderons donc à l'esprit des objectifs réalistes en terme d'applications potentielles, par la validation de nos propositions sur ces données réelles.

La recherche sur le thème général des flots de données se développe de manière importante dans le monde. En rassemblant des équipes actives dans le domaine, à l'INRIA et à proximité de l'INRIA, nous espérons obtenir des avancées dans des "niches" peu explorées pour l'instant, à savoir l'extraction de motifs temporels (séquentiels et non séquentiels) ainsi que l'évolution des motifs au cours du temps.