Thème : CogFDC

Rôle des connaissances en fouille de données complexes

 


Responsables : Brigitte Trousse (AxIS-Inria Sophia Antipolis) et Sylvie Despres (LIPN, - Université de Paris 13)

Depuis la création du groupe de travail sur la fouille de données complexes que ce soit lors des ateliers FDC à la conférence EGC ou lors de nos réunions du groupe, plusieurs approches ont été exposées lors des ateliers FDC pour appréhender :

Dans ce nouveau thème de travail, nous souhaitons mettre l'accent sur les approches fondées sur la prise en compte des connaissances dans un tel processus pour mieux comprendre leur rôle face à cette complexité. Par connaissances, nous entendons aussi bien des ontologies, des thesauri, etc. : celles-ci peuvent être issues du domaine analysé ou/et du domaine de l'analyste.

Tout d'abord nous évoquerons le rôle des connaissances issues du domaine analysé :

  • bien sûr dans la phase de pré-traitement/structuration des données
  • mais surtout dans la phase d'interprétation visant à extraire de nouvelles connaissances
  • et enfin dans la phase de mise à jour de la base de connaissances intiale.

Enfin la complexité aujourd'hui des processus de fouille de données nous poussent également à capitaliser des connaissances issues du domaine de l'analyste comme le sens donné aux principales prises de décision (sélection de variables, sélection de méthodes, etc.) : ici il s'agit par exemple d'annoter les résultats de chaque étape de ce processus en vue soit de faciliter l'étape suivante soit de faciliter une réutilisation de ce processus ultérieurement.

Ce thème vise donc principalement à faciliter les échanges et discussions scientifiques sur le lien connaissances et fouille de données complexes. Une liste non exhaustive des thèmes abordés est donnée à titre indicatif :

  • Rôle des Connaissances, Ontologies, Méta données en ECD complexe
  • Rôle des connaissances/ontologies du domaine analysé dans une étape ECD : pré-traitement, fouille de données et plus particulièrement dans l'étape d'interprétation
  • Mise à jour de la base de connaissances en utilisant les connaissances extraites (aspect itératif du processus ECD)
  • Modélisation et utilisation de connaissances du domaine de l'analyste en ECD
    • Métadonnées (PMML, ...) dans un processus ECD (global ou étape, en particulier celle de l'interprétation)
    • Ontologies dans le domaine ECD (DAMON,.. ) pour un processus ECD
    • Expériences d'analyses ECD et aide à la réutilisation d'un processus ECD
  • Web sémantique en ECD (PMML, DAMON, ...)
  • Applications de la FDC visant la construction d'ontologies (fouilles de textes, ...)
  • etc.