Khaled Khelif

Projet Edelweiss
INRIA Sophia Antipolis Méditerranée
2004 route des lucioles
06902 Sophia Antipolis

Téléphone :
+33 4 97 15 53 16

Télécopie :
+33 4 92 38 77 83


Activité actuelle (Depuis Avril 2006):

Ingénieur expert de recherche sur le projet Sealife (projet STREP avec La Biotec de Dresden, City University, Manchester University, Edinburgh University, Sionics et l'INRIA/Edelweiss).

L'objectif de ce projet est la conception et la réalisation d'un navigateur sémantique dédié aux sciences de la vie. Ce navigateur fera le lien entre le Web existant et l'infrastructure eScience qui est en train d'émerger. Le navigateur Sealife proposera à l'utilisateur des services Web eScience tout en prenant en considération le contenu sémantique des pages qu'il est en train de visiter. Ce navigateur sera testé avec trois scénarios portant sur (i) la médecine basée sur des faits (EBM), (ii) la fouille des brevets et de la littérature et (iii) la biologie moléculaire.
Le rôle d’Edelweiss dans ce projet est de proposer (i) des solutions de fouille de textes en se basant sur des ontologies et de les valider quantitativement et qualitativement, (ii) des techniques et des méthodologies pour la détection de profils d’utilisateurs afin de lui proposer des recommandations, (iii) des interfaces et des scénarios de recherche d’informations basés sur des ontologies, (iv) des contributions architecturales pour la composition automatique des services Web, et (v) des techniques d’annotation automatique des documents en se basant sur le texte et la structure de ces derniers (par exemple la fouille de brevets).
En ce qui me concerne, j’ai l’occasion de mener et/ou de participer à toutes ces différentes tâches vu que je représente l’équipe Edelweiss auprès des autres partenaires. Les résultats obtenus ont déjà fait l’objet de publications dans des conférences internationales et nationales.

Thèse (Novembre 2002 – Avril 2006) :

Titre : Web sémantique et mémoire d’expériences pour l’Analyse du Transcriptome >> PDF
Cette thèse rentre dans le cadre du projet MEAT (Mémoire d'Expériences pour l'Analyse du Transcriptome) dont le but est d'assister les biologistes travaillant dans le domaine des puces à ADN, pour l'interprétation et la validation de leurs résultats. Nous proposons une aide méthodologique et logicielle pour construire une mémoire d'expériences pour ce domaine. Notre approche, basée sur les technologies du web sémantique, repose sur l'utilisation des ontologies et des annotations sémantiques sur des articles scientifiques et d’autres sources de connaissances du domaine.
Dans une première partie, j’ai proposé une ontologie modulaire pour la description des connaissances du domaine des puces à ADN (base de données d’expériences, articles scientifiques, entités biomédicales…). Cette ontologie intègre entre autres, le réseau sémantique déjà existant d’UMLS, ce qui m’a permis d’approfondir le problème de réutilisation de ressources termino-ontologiques et leur adaptation à une nouvelle application. Ensuite, j’ai proposé une méthodologie générique pour la génération d’annotations sémantiques basées sur cette ontologie en exploitant les connaissances contenues dans les textes. Cette méthodologie a l’originalité d’utiliser des techniques de traitement automatique de la langue et des grammaires d’extraction de relations pour extraire automatiquement des articles scientifiques les relations reliant des termes d’UMLS reconnus dans le texte. Un système supportant cette méthodologie a été implémenté et validé par nos collègues biologistes. Enfin, pour faciliter la diffusion des connaissances contenues dans la mémoire, j’ai proposé un prototype qui se base sur un moteur de recherche sémantique (Corese) et qui exploite la base d’annotations que nous avons constituée. Cette partie du travail a permis d’améliorer la tâche de recherche d’informations en la rendant plus efficace et en offrant des mécanismes de raisonnement sur les connaissances du domaine.