curité et Surveillance
dans les Flots de Données

 

 

 

 

 

 

 

 

 

Accueil

Contexte

Problématique

Propositions

Applications

Equipes

Positionnement

Bibliographie

 

Réunions et CR

Equipe AxIS
INRIA
Sophia Antipolis

Equipe Dream
IRISA
Rennes

Equipe KDD
LGI2P/EMA
Nîmes

Equipe TATOO
LIRMM
Montpellier

 

 

Équipe AxIS - Inria Sophia Antipolis
L'équipe AxIS est basée sur une approche multi-disciplinaire pour l'analyse, la conception et l'amélioration des systèmes d'information. Les techniques développées font appel à des compétences en intelligence artificielle, fouille de données ou encore génie logiciel. Ces compétences complémentaires sont nécesaires pour atteindre nos objectifs principaux: 1) développer ds méthodes et outils pour aider à la fois à l'analyse d'un SI et à celle de son utilisation; 2) aider à la validation, la maintenance et l'amélioration de SIs. Actuellement nous travaillons sur les SIs basés sur le Web et les NTIC. Nos objectif en termes d'analyse des usages sont liés à des données volumineuses mais stockées et statiques. Dans le cadre de cette ARC, les techniques de fouille de données seront particulièrement présentes, dans le but de les faire progresser et de les adapter au contexte des flots de données. L'objectif pour AxIS est, entre autres, d'améliorer l'aspect pertinence des connaissances extraites et leur utilité dans un contexte applicatif réel avec des contraintes fortes comme celles exigées par une application à caractère sécuritaire.

Participants :

  • Yves Lechevallier - DR / Inria Rocquencourt
  • Alice Marascu - Doctorante (sujet : ``Extraction de Motifs Séquentiels dans les flots de données'').
  • Florent Masseglia - CR
  • Brigitte Trousse - CR

Équipe DREAM - IRISA Rennes
Le projet DREAM a pour thème de recherche principal l'aide à la surveillance et au diagnostic de systèmes ou activités complexes évoluant dans le temps. Les domaines d'application sont la santé, les télécommunications et l'environnement. Plus précisément, DREAM étudie l'utilisation de techniques de type ``reconnaissance de chroniques'' pour le diagnostic et la prédiction de pannes de systèmes dynamiques, ainsi que pour la surveillance et le diagnostic des pathologies cardiaques de patients.

Motivé par l'acquisition des chroniques, un autre sujet de recherche de l'équipe est l'acquisition de modèles temporels basés sur des chroniques par des techniques d'apprentissage symbolique et plus récemment de fouille de données de type relationnel. Nous nous sommes, pour l'instant, focalisés sur des données d'apprentissage statiques. L'extension des techniques à des données dynamiques telles que celles fournies par des flots de données est essentiel. Cet aspect est en particulier présent dans des applications industrielles que nous abordons telles que la sécurité dans les réseaux de télécommunications. Le travail commun avec les partenaires de cette ARC devrait nous permettre d'aborder cette problématique dans les meilleures conditions, en particulier en renforçant notre compétence en fouille de données.

Participants :

  • Marie-Odile Cordier - Professeure / Université de Rennes 1
  • René Quiniou - CR Inria
  • Alexandre Vautier - Doctorant (sujet : ``Intégration de contraintes temporelles dans les bases de données inductives. Application à la détection d'intrusion.'')

L'équipe KDD LGI2P/EMA Nîmes
L'un des thème de recherche du LGI2P concerne les risques et la décision. Dans ce cadre, il s'intéresse plus particulièrement au suivi et au contrôle d'activités complexes au cours du temps. Parmi les dernières domaines d'applications traités par le centre, nous pouvons citer la santé (détection de chutes de personnes agées), le transport, les détection de fraudes dans le cas d'opérateur téléphonique, ou encore la supervision de procédés continus dynamiques. Parmi les sujets de recherche abordés, l'équipe s'intéresse aux techniques de fouilles associées à la classification, au clustering et à l'extraction de séquences. En ce qui concerne ce dernier point, les premières approches proposées se sont intéressées à des bases de données statiques puis à la possibilité de considérer l'ajout de nouvelles données. Depuis cette année, nous nous intéressons à l'apprentissage de ces séquences dans un cadre de flots de données. La participation à ce projet nous offrira la possibilité d'étendre nos propositions à la prise en compte de données de plus en plus complexes et à renforcer nos compétences en considérant également un apprentissage supervisé.

Participants :

  • Gérard Dray - Enseignant Chercheur
  • Jacky Montmain - Chercheur CEA
  • Pascal Poncelet - Professeur
  • Chedy Raissi - Doctorant (sujet : ``Détection de motifs séquentiels dans les data streams'')

Équipe TATOO - LIRMM Montpellier
Les travaux menés au sein du projet Ingénierie des Données et des Connaissances du LIRMM dans le contexte de l'extraction de connaissances portent sur la fouille de données dans les bases de données complexes (e.g. données structurées, semi structurées, multidimensionnelles, qualitatives et quantitatives, textuelles etc.) et dynamiques, sur la fouille de données approximatives et l'aide à la décision. L'un des domaines d'application du projet concerne l'aide au diagnostic et à la prévention de pannes dans un système dynamique de capteurs solaires. Les travaux récents traitent de la recherche de motifs séquentiels multidimensionnels comme une approche réellement générique applicable aussi bien aux cubes de données qu'aux données enrichies, de motifs séquentiels flous comme aide à la prise en charge des valeurs manquantes. La participation à ce groupe de recherche nous permettra d'affiner nos connaissances dans le domaine de l'apprentissage supervisé. En outre, elle permettra de favoriser l'émergence de solutions permettant de considérer les données issues du monde réel dans la gestion des flots de données sans perte d'information. Ces données, souvent définies sur plusieurs dimensions et entachées d'erreurs et d'imprécisions, sont en effet la plupart du temps difficilement appréhendables par les méthodes classiques qui les réduisent en des données simples, ce qui entraîne des lacunes dans la connaissance produite.

Participants :
  • Céline Fiot - Doctorante (sujet : ``Motifs séquentiels et prise en compte des données manquantes ou incomplètes'')
  • Anne Laurent - MCF
  • Marc Plantevit - Doctorant (sujet : ``Fouille de données pour les bases de données multidimensionnelles'')
  • Maguelonne Teisseire - MCF

Collaborations et synergie entre les équipes

L'objectif de SÉSUR est de favoriser les synergies et les échanges entre des Centres de Recherche INRIA et des Laboratoires qui s'intéressent à la problématique de la fouille de données dans les flots de données. Plus précisément, nous souhaitons profiter des expériences complémentaires pour être à même de proposer de nouvelles approches et de valider leur utilité et leur efficacité afin d'améliorer la sécurité et la surveillance des systèmes observés.

Afin d'assurer la collaboration et l'échange d'informations entre les différentes équipes constituant ce projet, et constituer un noyau de compétences sur le thème étudié, nous envisageons trois principales actions :

  • Durant la première partie du projet (6 mois), un des objectifs est de rédiger un état de l'art tirant parti des compétences et des connaissances complémentaires de chacune des équipes. En particulier, une attention particulière sera apportée à présenter de manière unifiée les approches d'extraction de motifs utilisées par les différents projets qu'elles soient de type non supervisé ou supervisé.
  • Nous prévoyons de mettre en place une boîte à outils, rassemblant les logiciels communs et permettant le partage des logiciels existants ou développés par les équipes.
  • Nous prévoyons d'échanger nos données d'expérimentations afin d'avoir un terrain d'application commun, en particulier lors de l'étape validation.
  • Des réunions régulières sont prévues (voir le budget) afin d'enrichir la réflexion de chacune des équipes du projet et assurer un avancement cohérent de nos travaux.
  • Un espace de travail collaboratif (forge) propre au projet SÉSUR sera mis en place afin de réunir les informations sur l'avancement du projet, de mettre en commun les compte-rendus de réunions, les articles publiés, les données et toute information susceptible d'aider au bon avancement du projet.