Troisième atelier sur la
"Fouille de données complexes
dans un processus d'extraction des connaissances
"

17 Janvier 2006

Lille, France

http://www-sop.inria.fr/axis/fdc-egc06/

Programme de la journée

Actes de l'atelier


Présentation

L’atelier sur la fouille de données complexes dans un processus d’extraction de connaissances est organisé à l'instigation du  groupe de travail « Fouilles de Données Complexes »  GT FDC et s’inscrit dans le cadre de la conférence EGC. Cet atelier se veut être un lieu de rencontre annuel où chercheurs/industriels peuvent partager leurs expériences et expertises dans le domaine de la fouille de données. L'atelier se veut ouvert en terme de propositions. On pourra y présenter aussi bien un travail abouti, des réflexions sur la fouille de données complexes ou un travail préliminaire (qui présentera davantage un problème qu'une solution). Enfin, les discussions sur les liens entre différentes disciplines sont également bienvenues.

Les deux premières éditions de cet atelier au sein d’EGC (2004 à Clermont-Ferrand et 2005 à Paris) furent une réelle réussite, accueillant des chercheurs/doctorants représentant plus de 30 laboratoires francophones différents. Ils auront permis d'avancer sur la compréhension de la complexité d'un processus d'extraction de connaissances à partir de bases de données et d'initier de nouveaux échanges scientifiques entre chercheurs.

La troisième édition de cet atelier  aura lieu dans le cadre de EGC06 (Lille).

Thèmes

Dans tous les domaines, les données à traiter pour y extraire de la connaissance utilisable sont de plus en plus complexes et volumineuses. Ainsi est-on amené à devoir manipuler des données :

Aussi la fouille de données complexes ne doit plus être considérée comme un processus isolé mais davantage comme une des étapes du processus plus général d'extraction de connaissances à partir de données (ECD). En effet, les difficultés liées à la complexité des données se répercutent sur toutes les étapes du processus d’ECD : avant d'appliquer des techniques de fouille dans les données complexes, ces dernières nécessitent un travail préparatoire (principalement de structuration et d’organisation de ces données complexes). Parallèlement, de nouvelles méthodes de fouille (classification, catégorisation, recherche de motifs fréquents, etc.) doivent également être définies dans ce contexte de la complexité des données. Enfin la notion d'utilité des paradigmes extraits (anticiper la pertinence des résultats de la fouille) est également un problème à étudier.

Afin de dresser un panorama des travaux récents dans le domaine de la fouille de données complexes, seront particulièrement appréciés (liste non exhaustive) des articles présentant un état de l'art et des perspectives ouvertes dans ce domaine ; des études comparatives de différentes approches de fouille dans des données complexes ou d’approches relatives aux différentes étapes du processus d’ECD dans ce contexte ; la présentation argumentée de nouvelles approches d’ECD pour la fouille de données complexes ; des descriptions d'applications réelles mettant en jeu un processus de fouille de données complexes.

Une liste de thèmes est donnée ci-dessous à titre indicatif.

Déroulement envisagée de la journée

L'atelier sera constitué d'une série d'exposés (présentations orales ou poster). Les articles feront l'objet de rapports de lecture dans le double but d'améliorer leur qualité et de donner des conseils aux auteurs. Une place privilégiée est accordée aux jeunes chercheurs et à la présentation des travaux en cours dans les différentes équipes. Cela peut être l'occasion pour un doctorant de présenter son projet de recherche. Cette partie est particulièrement importante pour les travaux qui commencent et pour la mise en place de groupes de recherche sur des thèmes partagés. Les présentations de posters pourront s'accompagner de démonstrations de résultats de recherches.

Une réunion du groupe de travail " Fouille de données complexes " est prévue à la suite de l’atelier.

Format de soumission :

Les auteurs sont invités à soumettre électroniquement leur proposition à fdc@sophia.inria.fr. Le courrier électronique devra comporter la soumission au format PDF (on trouve un convertisseur gratuit sur http://www.pdf995.com/) ainsi que les nom, prénom, adresse, téléphone, fax et adresse électronique d'un des auteurs.

La taille des soumissions sera de 12 pages maximum. Elle pourra être beaucoup plus courte, en particulier pour les articles présentant un travail qui débute. Le message électronique de la soumission devra être accompagné d'une liste de mots-clés.

Publication : Les communications retenues sous forme de présentations orales ou affichées seront éditées dans les actes du workshop par EGC06. Les communications devront respecter le format de mise en page de la Revue des Nouvelles Technologie de l'Information (RNTI) afin d'homogénéiser les contributions. Celui-ci est décrit dans un fichier que vous pourrez télécharger à  http://www-sop.inria.fr/axis/fdc-egc05/FormatFDC.zip

En plus de ces actes, nous envisageons de publier un recueil d'articles sélectionnés dans une deuxième édition spéciale de la revue des nouvelles technologies de l’information sur la fouille de données complexes (D. Zighed et G. Venturini). Ces articles décriront des travaux originaux, n'ayant pas déjà fait l'objet de publication, et non soumis pour publication ; ils feront l'objet d'un deuxième processus de relecture approfondi.

La langue officielle de l’atelier sera le français.

Dates importantes

Responsables

Comité de lecture

Le comité de lecture sera composé d'un représentant par laboratoire membre du GT "Fouilles de Données Complexes" et d'experts du domaine.