Apprentissage décentralisé et ses applications industrielles

Statut

Pourvue

Disciplines scientifiques

Informatique et Sciences de l'Information

Direction de recherche

Sciences et technologies du numérique

Site de rattachement

Rueil-Malmaison

Dans de nombreux problèmes de contrôle venant du monde industriel, plusieurs agents interagissent dans un environnement partagé et peuvent être soumis à certaines contraintes. Ces contraintes sont souvent imposées pour garantir la sécurité du système physique, par exemple dans une ferme éolienne, les turbines doivent satisfaire certaines contraintes pour éviter trop de fatigue qui peut nuire à leur structure physique. Malgré son importance, prendre en compte des contraintes dans le cadre d’apprentissage par renforcement multi-agents (MARL pour Multi-Agent RL, RL pour Reinforcement Learning) est un sujet qui a émergé ces dernières années. L’objectif de cette thèse est de développer de nouveaux algorithmes MARL qui sont capables de prendre en compte des contraintes de sécurité, dans le cas où les agents collaborent mais exécutent des actions de manière décentralisée. D’une part, pour un meilleur passage à l’échelle, nous souhaitons rendre les algorithmes les plus décentralisés possible. Une étude des garanties de convergence des algorithmes développés est envisagée pour parvenir à une compréhension théorique sur les performances et/ou les limitations de nos solutions. D’autre part, nous souhaitons aboutir à des algorithmes simples qui peuvent être appliqués à d’autres problèmes similaires, sans, ou avec peu de réglage des paramètres des algorithmes. Afin de mettre en œuvre des développements théoriques, nous souhaitons répondre aux problématiques soulevées par le contrôle des parcs éoliens, en particulier, le contrôle d’un parc pour en maximiser sa production totale en prenant en compte les contraintes mécaniques induites par ce contrôle sur les turbines.

Mots clefs: apprentissage décentralisé, apprentissage par renforcement, multi-agent

  • Directeur de thèse   Prof.  Ana BUSIC, INRIA Paris / DI ENS, Université PSL, ORCID : 0000-0002-4133-3739
  • Ecole doctorale    ED386, DI ENS
  • Encadrant IFPEN    Dr Jiamin ZHU, ORCID : 0000-0002-4552-5519
  • Localisation du doctorant    IFPEN, Rueil-Malmaison, France & INRIA, Paris, France
  • Durée et date de début    3 ans, début au cours du quatrième trimestre 2024 
  • Employeur    IFPEN
  • Qualifications    Master en mathématique ou informatique
  • Connaissances linguistique    Anglais niveau B2 (CECR)
  • Autres qualifications    Compétences en programmation : Python, Matlab/Simulink


Pour postuler, merci d’envoyer votre lettre de motivation et votre CV à l’encadrant IFPEN indiqué ci-dessous.

Contact
Encadrant IFPEN :
Dr Jiamin ZHU
Doctorant(e) de la thèse :
Promotion 2024-2027