curité et Surveillance
dans les Flots de Données

 

 

 

 

 

 

 

 

 

Accueil

Contexte

Problématique

Propositions

Applications

Equipes

Positionnement

Bibliographie

 

Réunions et CR

Equipe AxIS
INRIA
Sophia Antipolis

Equipe Dream
IRISA
Rennes

Equipe KDD
LGI2P/EMA
Nîmes

Equipe TATOO
LIRMM
Montpellier

 

Faire évoluer les connaissances extraites d'un flot de données

Participants: Dream (Inria), KDD (LGI2P/EMA Nimes), AxiS (Inria), TATOO (LIRMM)

Gestion fine de l'historique des fréquents
La gestion de l'historique des motifs fréquents dans les flots de données est jusqu'ici basée sur le principe que ``l'on est généralement plus intéressé par les changements récents que par les changements plus anciens''. Les méthodes proposées ont alors eu pour objectif de stocker les historiques avec une granularité fine pour les événements récents et une granularité plus grande pour les événements anciens. C'est le cas pour les méthodes de fouille dans les flots proposées par Alice Marascu (AxIS) [22] ou par Chedi Raissi (LGI2P/TATOO) [33]. Nous pensons que la gestion de l'historique ne doit pas être guidée par l'ancienneté des valeurs, mais plutôt par la variation de ces valeurs. Il s'agit donc de dire que ``l'on est plus intéressé par les changements brusques ou marquants que par l'absence de changement''. Nous proposons de développer des techniques de gestion des historiques, capables de s'adapter à l'évolution des fréquences demande d'étudier les méthodes de discrétisation. De plus, l'historique étant perpétuellement remis à jour, les échelles de valeurs vont changer (ce qui était considéré comme une évolution marquante devient monotone compte tenu des nouvelles valeurs).

Evaluation en ligne de la qualité des connaissances apprises
La qualité des connaissances apprises vis à vis du flot considéré est primordiale. Le problème principal provient du fait que les connaissances ont été apprises à partir d'un ensemble de données limité (une fenêtre temporelle ou un résumé). Il faut donc s'assurer que leur qualité reste suffisante vis à vis des données courantes et si besoin, les faire évoluer pour maintenir une qualité optimale. Ceci est d'autant plus important lorsque le système concerné évolue dans le temps (patient sous monitoring, procédé industriel dont les réglages évoluent, prise en compte de l'usure, etc.). Notre objectif est donc de proposer un ensemble d'indicateurs permettant d'évaluer la qualité en continu. Ceci peut se faire de différentes manières qu'il faudra comparer et éventuellement combiner : critères statistiques régulièrement vérifiés, réexamen de l'historique, prise en compte de la qualité de la détection ou de l'efficacité des décisions prises, confrontation à d'autres sources d'expertise, intervention d'un expert humain.

Evolution des connaissances apprises en fonction du flot de données
Les connaissances apprises (en particulier lorsqu'elles sont utilisées dans un contexte de détection) doivent être constamment ajustées pour améliorer, d'une part, la qualité de représentation qu'elles donnent du flot et, d'autre, part la qualité de détection qui en dépend. L'objectif est d'utiliser les résultats obtenus en détection et surveillance pour faire évoluer l'ensemble des chroniques. Il faudra identifier les chroniques responsables d'une baisse de qualité, et proposer des modifications, qui pourront nécessiter des changements des contraintes temporelles, l'ajout ou la suppression d'événements, et même l'ajout ou la suppression des chroniques elles-même. Un autre point sera de prévoir des indicateurs pour contrôler l'effet positif de ces modifications. Ces indicateurs pourront probablement être proches de ceux proposés dans le paragraphe précédent.