Développement d'une méthode d'analyse comparative jointe de données omiques (multi-souches/conditions) : application au champignon filamenteux Trichoderma reesei

Statut

En cours

Disciplines scientifiques

Informatique et Sciences de l'Information

Direction de recherche

Sciences et technologies du numérique

Site de rattachement

Rueil-Malmaison

IFPEN conduit des recherches pour optimiser des procédés biotechnologiques dans le domaine de la chimie biosourcée et des biocarburants. Une part significative de ces améliorations est basée sur la biologie systémique qui permet d’accroitre la connaissance des mécanismes moléculaires des microorganismes. Dans ce but, des données omiques sont collectées pour représenter les différentes strates de régulation d’une cellule en fonction de conditions données. Toutefois, le traitement de ces données est généralement réalisé par strate et exploite difficilement la complémentarité des régulations. Pour notre organisme modèle, un compendium de données génomiques, transcriptomiques et épigénétiques a été rassemblé pour deux souches et dans deux conditions différentes. Dès lors, comment extraire les comportements différentiels d'un système biologique par combinaison de différentes modalités expérimentales ?
Pour répondre à cette question, un travail de thèse ambitieux et incrémental est envisagé. La finalité est de développer un nouvel outil bio-informatique identifiant les mécanismes systémiques invariants conjointement à ceux spécifiques des conditions expérimentales. Une première analyse, basée sur des approches bayésiennes, sera étudiée pour identifier le sous-ensemble de gènes conjointement invariants au travers des conditions et modalités expérimentales. Une seconde approche complémentaire basée sur de la séparation de source sera ensuite évaluée pour détecter conjointement les sous-ensembles de gènes variants et invariants. Nous proposons ensuite d’utiliser ces sous-ensembles pour projeter les données dans un espace de faible dimension, densifiant les données des gènes invariants. Ainsi une distance des gènes variants aux gènes invariants pourra être calculée. Ce type d’analyse différentielle conjointe des données omiques permettra d’améliorer la compréhension de notre organisme modèle.
Mots clefs: Données multi-omiques, intégration de données, analyse différentielle, approche bayésienne, séparation de source, réduction de dimension. 

  • Directeur de thèse    Pr Marie-Hélène MUCCHIELLI-GIORGI , Institut de Biologie Intégrative de la cellule – Université Evry Val d’Essonne
  • Ecole doctorale    ED Sciences du végétal - https://www.universite-paris-saclay.fr/ecoles-doctorales/sciences-du-vegetal-du-gene-lecosysteme-seve
  • Encadrant IFPEN    Dr Aurélie CHATAIGNON  IFPEN, Sciences et Technologies du Numérique
  • Localisation du doctorant    IFP Energies nouvelles, Rueil-Malmaison, France
  • Durée et date de début    3 ans, début au cours du quatrième trimestre 2023
  • Employeur    IFP Energies Nouvelles, Rueil-Malmaison, France
  • Qualifications    Master en Mathématiques, Informatique, Sciences de l’information
  • Connaissances linguistiques    Bonne maîtrise du français indispensable et bonne maîtrise de l’anglais souhaitable
  • Autres qualifications    Mathématique appliquée, approche bayésienne, optimisation, appétence pour la biologie/bioinformatique, sensibilité à la science des données
Contact
Encadrant IFPEN :
 Dr, Aurélie CHATAIGNON
Doctorant(e) de la thèse :
Promotion 2023-2026