Statut
Disciplines scientifiques
Direction de recherche
Sciences et technologies du numérique
Site de rattachement
Rueil-Malmaison
IFPEN conduit des recherches pour optimiser des procédés biotechnologiques dans le domaine de la chimie biosourcée et des biocarburants. Une part significative de ces améliorations est basée sur la biologie systémique qui permet d’accroitre la connaissance des mécanismes moléculaires des microorganismes. Dans ce but, des données omiques sont collectées pour représenter les différentes strates de régulation d’une cellule en fonction de conditions données. Toutefois, le traitement de ces données est généralement réalisé par strate et exploite difficilement la complémentarité des régulations. Pour notre organisme modèle, un compendium de données génomiques, transcriptomiques et épigénétiques a été rassemblé pour deux souches et dans deux conditions différentes. Dès lors, comment extraire les comportements différentiels d'un système biologique par combinaison de différentes modalités expérimentales ?
Pour répondre à cette question, un travail de thèse ambitieux et incrémental est envisagé. La finalité est de développer un nouvel outil bio-informatique identifiant les mécanismes systémiques invariants conjointement à ceux spécifiques des conditions expérimentales. Une première analyse, basée sur des approches bayésiennes, sera étudiée pour identifier le sous-ensemble de gènes conjointement invariants au travers des conditions et modalités expérimentales. Une seconde approche complémentaire basée sur de la séparation de source sera ensuite évaluée pour détecter conjointement les sous-ensembles de gènes variants et invariants. Nous proposons ensuite d’utiliser ces sous-ensembles pour projeter les données dans un espace de faible dimension, densifiant les données des gènes invariants. Ainsi une distance des gènes variants aux gènes invariants pourra être calculée. Ce type d’analyse différentielle conjointe des données omiques permettra d’améliorer la compréhension de notre organisme modèle.
Mots clefs: Données multi-omiques, intégration de données, analyse différentielle, approche bayésienne, séparation de source, réduction de dimension.
- Directeur de thèse Pr Marie-Hélène MUCCHIELLI-GIORGI , Institut de Biologie Intégrative de la cellule – Université Evry Val d’Essonne
- Ecole doctorale ED Sciences du végétal - https://www.universite-paris-saclay.fr/ecoles-doctorales/sciences-du-vegetal-du-gene-lecosysteme-seve
- Encadrant IFPEN Dr Aurélie CHATAIGNON IFPEN, Sciences et Technologies du Numérique
- Localisation du doctorant IFP Energies nouvelles, Rueil-Malmaison, France
- Durée et date de début 3 ans, début au cours du quatrième trimestre 2023
- Employeur IFP Energies Nouvelles, Rueil-Malmaison, France
- Qualifications Master en Mathématiques, Informatique, Sciences de l’information
- Connaissances linguistiques Bonne maîtrise du français indispensable et bonne maîtrise de l’anglais souhaitable
- Autres qualifications Mathématique appliquée, approche bayésienne, optimisation, appétence pour la biologie/bioinformatique, sensibilité à la science des données