L'équipe Acacia propose une bourse de thèse sur le sujet : "Web sémantique et Mémoire d'expériences sur l'analyse du Transcriptome" Objectifs poursuivis : L'activité du biologiste lors d'une expérience exploitant la technologie des biopuces d'ADN peut être décomposée en trois tâches principales: 1. L'expérimentation : expérimentation biologique (préparation de l'échantillon à tester, extraction des ARN, etc.) et expérimentation spécifique avec la biopuce (marquage et hybridation de l'ARN sur la biopuce, quantification de la lame) ; 2. La validation de ces résultats, à travers une recherche bibliographique dans les publications scientifiques et par comparaison avec des données antérieures ; 3. L'interprétation des résultats d'expériences : en mettant en rapport les variations observées avec les manifestations biologiques connues associées à la manipulation. L'objectif de la thèse est la conception et la gestion d'une mémoire d'expériences (à des fins de capitalisation, partage, diffusion) afin de faciliter l'implantation de la technologie des puces ADN dans la région PACA etd'en faire bénéficier les membres du secteur biomédical de la région. La conception de cet mémoire soulève les problèmes de recherche suivants: · Quelles aides méthodologiques et logicielles peut-on apporter pour la capitalisation et la valorisation des connaissances dans ce contexte ? · Quelle architecture générique peut-on proposer pour la conception d'une mémoire de communauté? · Comment améliorer la qualité de la recherche d'information dans une telle mémoire (en particulier en exploitant les technologies actuelles du Web sémantique et la recherche d'information guidée par des ontologies) ? Méthodologie proposée : Après un état de l'art sur la capitalisation des connaissances en biologie et sur le Web sémantique (cf. ontologies, recherche d'information sur le Web, fouille du Web), l'étudiant approfondira les possibilités d'aide méthodologique et logicielle pour la capitalisation et la valorisation des connaissances au sein de la mémoire d'expériences : Pour la conception de la base d'expériences : 1. Construction de l'ontologie de la mémoire. Il s'agira de concevoir une ontologie qui reposera sur 1) une ontologie du domaine déjà créée: Gene Ontology et 2) une ontologie dédiée à l'expérimentation des puces à ADN. 2. Aide à la construction de la base d'expériences. Il s'agira de concevoir un éditeur d'expériences qui permettra aux biologistes de publier leurs expériences selon le format XML. 3. Aide à l'annotation des expériences. Il s'agira de proposer des techniques pour annoter semi-automatiquement les expériences décrites dans la base d'expériences en exploitant les techniques de langage naturel. On visera l'annotation des descriptions d'expériences ainsi que l'annotation de l'interprétation des résultats de l'expérience par un biologiste donné. Ce même biologiste validera les annotations proposées par le système. La prise en compte de plusieurs points de vue dans les annotations permettra en outre une plus grande flexibilité. 4. Aide à la valorisation des connaissances de la mémoire. Il s'agira de proposer des moyens pour aider la détection les relations entre expériences formalisées (par exemple par l'exploitation de règles d'inférence) . La valeur ajoutée se fera par le biais de la synthèse de ces relations. Pour la conception de la base des résultats de recherche d'information : 1. Proposition d'une ontologie dédiée à différents sites Web pertinents (cette ontologie devant ensuite permettre de guider la recherche d'information sur le Web). 2. Aide à la consignation des résultats pertinents de recherche d'information sur le Web, ces résultats seront annotés par l'auteur de la recherche d'information. 3. Aide à la valorisation des connaissances de la mémoire grâce à la synthèse des résultats de recherche d'information. Calendrier de réalisation : · Etat de l'art · Etude des problèmes liés à la construction de la base d'expériences et proposition de techniques pour étendre la " Gene ontology " par des concepts et des relations relatifs aux biopuces à ADN (en exploitant au besoin des outils de traitement automatique de la langue naturelle sur les corpus des articles pertinents). · Aide à l'annotation semi-automatique des expériences suivant plusieurs points de vue (en exploitant au besoin des outils de traitement automatique de la langue naturelle sur les corpus des articles pertinents). · Aide à la recherche d'information dans la base d'expériences en reposant sur l'ontologie, sur les annotations et sur le moteur de recherche sémantique CORESE. · Aide à la recherche d'information sur les articles scientifiques sur le Web et dans la base d'expériences en reposant sur l'ontologie, sur les annotations et sur le moteur CORESE. · Techniques de fouille de données pour détecter des relations entre expériences formalisées. La thèse, financé par une bourse régionale, se déroulera l'INRIA-Sophia-Antipolis, dans le cadre d'une collaboration régionale avec l'Institut de Pharmacologie Moléculaire et Cellulaire (IPMC) et Aventis Crops Science. CONDITIONS: - - L'étudiant(e) devra avoir moins de 28 ans (né après le 1er décembre 1974) et obtenu son DEA (ou équivalent) si possible cette année et avec mention. - Sa première inscription en thèse se fera à la rentrée 2002, à l'Université de Nice Sophia-Antipolis. - Compétences sur au moins l'un des thèmes suivants : ontologies, XML et le Web sémantique, ingénierie des connaissances, acquisition des connaissances à partir des textes, recherche d'information, fouille de textes ou fouille de données ou IHM - Fort intérêt pour la biologie et capacités de communication aisée avec les biologistes Remarque: Les 2 premières containtes sont liées au fait qu'il s'agit d'une bourse régionale. DOSSIER DE CANDIDATURE: Envoyer une lettre de motivation + un CV détaillé + le relevé de notes de DEA (par fax à Rose Dieng-Kuntz au 04 92 38 77 83) + éventuellement le mail d'un enseignant ou chercheur pouvant vous recommander à : Rose.Dieng@sophia.inria.fr