Date : Le 27 février 2002

Lieu : IRISA RENNES


Compte-rendu réunion de suivi projet

GénoGRID une grille pour la génomique

Présents:
M. Cosnard (Directeur de l'ACI GRID)


- Brigitte Plateau (Pdt Conseil scientifique, nommée pour CONCERTO)
- Eric Sonnenbrucker (Expert nommé pour GRID2)
- Michel Riveill (Expert nommmé pour RMI)
- Gilbert Deléage (Expert nommé pour GENOGRID)
- Luc Bougé (Membre du Conseil scientifique)
- Dominique Lavenier (Coordinateur GénoGRID)
- Hugues Leroy (GénoGRID/IR INRIA)
- M.Hurfin CR INRIA, IRISA, Rennes (GénoGRID)
- P. Cotty ( GénoGRID / Ingénieur IFREMER)
- M. Samson, CR INSERM, U435, Rennes

- Yves Mahéo (Coordinateur Concerto)
- Frédéric Guidec (Concerto)
- J.Louis Pazat (Coordinateur GRID2)
- JM Geib
(Projet GRID2)
- Jens Gustedt (Projet GRID2)
- Denis Trystram (Projet GRID2)
- El-Ghazali Talbi (Projet GRID2)
- Christian Perez (Projet GRID2)
- Sylvie Poupinel (Coordinatrice ACI GRID)

Agenda:
Partenaires du projet :
M. Hugues Leroy
IR "INRIA", "IRISA", Rennes
M. Laurent Mouchard
Maitre de conference, ABISS, Rouen
M. Michel Hurfin
CR "INRIA", "IRISA", Rennes
M. Rumen Andonov
Professeur, LAMIH, Valenciennes
M. Frédéric Guinand
Maître de Conférences
LIH (Laboratoire Informatique du Havre)
Mme Maude Pupin
Maître de Conférences LIFL (Laboratoire d'Informatique Fondamentale de Lille)
M. Grégory Kucherov
CR "INRIA", "LORIA", Nancy
M. Didier Flament
Ingénieur IFREMER
M. Olivier Collin
IR CNRS, Responsable Informatique station biologique de Roscoff
M. Michel Samson
CR INSERM, U435, Rennes
Pierre Cotty,
Ingénieur, IFREMER,Brest

 

 

Coordinateur du projet :

Dominique LAVENIER
CR CNRS
IRISACampus de Beaulieu - 35042 Rennes

 

 

 

 

Présentation Projet GénoGRID :
catégorie projet Pluridisciplinaire
Dominique LAVENIER présente Le projet GénoGRID qui a pour objectif de mettre en place un portail par lequel des chercheurs en biologie pourront accéder à des ressources en calcul réparties géographiquement, et effectuer des traitements coûteux en génomique. Ces ressources sont hétérogènes et proviennent des centres de recherche et/ou de calcul directement impliqués dans ce domaine de recherche. Le but est que l'accès à cette grille de ressources soit simple et transparent, à l'image des serveurs existants qui mettent à disposition de la communauté scientifique des services standards d'analyse de séquences génomiques variés mais limités. Les 3 applications qui seront traitées sont déjà connues et servent de point de départ pour adjoindre d'autres applications :
1/comparaison intensive [M. Michel Samson]
GERM Groupe d'étude de la reproduction chez le mâle : Suite à l'étude des ressemblances entre génomes humains et virales, construction d'une banque spécialisée "GermBank" basée sur des mots-clefs (160 000 séquences).
Discussion entre Gilbert Deléage et l'équipe: Gilbert Deléage souhaite savoir pourquoi l'extraction des données doit elle se faire sur mots clefs au lieu d'un système mixte avec séquence + mots clefs ?
Réponse de l'équipe : les séquences relatives au génome humain ou aux génomes de la souris (ou du rat) sont parmi celles qui sont les mieux annotées. Mais nous
avons conscience que le filtrage n'est pas optimale.
2/Repliement des protéines [M. Rumen Andonov]
Les techniques d'analyse fonctionnelle in silico ont pour but d'assigner une fonction au produit des gènes identifiés. Ces méthodes sont fondées sur des recherches d'homologie avec des protéines de bases de données. L'objectif est de prédire in silico la structure 3D d'une protéine afin de pouvoir déterminer sa fonction.

M. Hugues Leroy présente l'outil indispensable de ce projet : un portail Internet qui doit fournir à une communauté homogène d'utilisateurs (biologistes et bio-informaticiens) un moyen d'accès simple aux ressources de calcul : comment régler l'accès transparent aux ressources distribuées et gérées par des organisations distinctes n'ayant pas forcément les mêmes procédures d'exploitation, comment assurer la migration des résultats tout en garantissant la confidentialité, comment régler l'allocation des ressources et le partage de charge, etc.L'équipe va réaliser un portail où l'authentification des utilisateurs se fera une seule fois, et des signatures électroniques (certificats) leur seront attribuées. Le portail comprendra des répertoires de données notant pour chaque utilisateur ses prérogatives (droits d'accès aux applications, aux ressources, …), pour chaque application la liste des sites où elle peut s'exécuter, la liste de ses paramètres, etc.
Question de Michel Cosnard à l'équipe: Michel Cosnard souhaite savoir quelle garantie offre le certificat.
Hugues Leroy répond que pour l'utilisateur le certificat offrira la garantie d'une authentification.
Discussion entre Gilbert Deleage et l'équipe:
Gilbert Deléage questionne l'équipe sur l'interactivité du portail Web Hugues
Leroy explique que l'usager pourra choisir un service parmi plusieurs et le paramétrer. La requête est alors traitées via un module spécifique (Dispatch sur la figure) qui a connaissance de la distribution des ressources, tant d'un point de vue puissance de calcul que disponibilité des données au sein de chaque nœud. Eden est alors mis à contribution pour sélectionner la ou les ressources capables de prendre en charge cette requête. L'attribution effective des moyens informatiques est finalement réalisée par les allocateurs de ressource présents sur chaque nœud.
Michel Hurfin intervient au niveau des problèmes du placement des tâches (" resources management ") et de l'équilibrage de charge (" load balancing ") qui sont essentiels. En fonction de la nature de sa requête et des droits d'accès qui lui ont été accordés, un utilisateur doit pouvoir soumettre sa requête sans se soucier des problèmes liés à la sélection des machines qui seront en charge de traiter cette requête. Bien évidemment, cette transparence peut être obtenue via différentes stratégies reposant sur des hypothèses plus ou moins restrictives. ...). Dans le cadre de ce projet, l'équipe souhaite exploiter les fonctionnalités offertes par le logiciel Eden qui est développé à l'IRISA au sein du projet ADP.

Michel Cosnard pense que c'est une équipe de trés grande qualité avec des personnes travaillant sur les Algorithmes depuis 10 ans qui se retrouvent dans le projet.