Apprentissage décentralisé et ses applications industrielles

Dans de nombreux problèmes de contrôle venant du monde industriel, plusieurs agents interagissent dans un environnement partagé et peuvent être soumis à certaines contraintes. Ces contraintes sont souvent imposées pour garantir la sécurité du système physique, par exemple dans une ferme éolienne, les turbines doivent satisfaire certaines contraintes pour éviter trop de fatigue qui peut nuire à leur structure physique. Malgré son importance, prendre en compte des contraintes dans le cadre d’apprentissage par renforcement multi-agents (MARL pour Multi-Agent RL, RL pour Reinforcement Learning) est un sujet qui a émergé ces dernières années. L’objectif de cette thèse est de développer de nouveaux algorithmes MARL qui sont capables de prendre en compte des contraintes de sécurité, dans le cas où les agents collaborent mais exécutent des actions de manière décentralisée. D’une part, pour un meilleur passage à l’échelle, nous souhaitons rendre les algorithmes les plus décentralisés possible. Une étude des garanties de convergence des algorithmes développés est envisagée pour parvenir à une compréhension théorique sur les performances et/ou les limitations de nos solutions. D’autre part, nous souhaitons aboutir à des algorithmes simples qui peuvent être appliqués à d’autres problèmes similaires, sans, ou avec peu de réglage des paramètres des algorithmes. Afin de mettre en œuvre des développements théoriques, nous souhaitons répondre aux problématiques soulevées par le contrôle des parcs éoliens, en particulier, le contrôle d’un parc pour en maximiser sa production totale en prenant en compte les contraintes mécaniques induites par ce contrôle sur les turbines.

Mots clefs: apprentissage décentralisé, apprentissage par renforcement, multi-agent

Directeur de thèse Prof. Ana BUSIC, INRIA Paris / DI ENS, Université PSL, ORCID : 0000-0002-4133-3739
Ecole doctorale ED386, DI ENS
Encadrant IFPEN Dr Jiamin ZHU, ORCID : 0000-0002-4552-5519
Localisation du doctorant IFPEN, Rueil-Malmaison, France & INRIA, Paris, France
Durée et date de début 3 ans, début au cours du quatrième trimestre 2024
Employeur IFPEN
Qualifications Master en mathématique ou informatique
Connaissances linguistique Anglais niveau B2 (CECR)
Autres qualifications Compétences en programmation : Python, Matlab/Simulink

Pour postuler, merci d’envoyer votre lettre de motivation et votre CV à l’encadrant IFPEN indiqué ci-dessous.

Contact

Encadrant IFPEN :

Dr Jiamin ZHU

jiamin.zhu@ifpen.fr

Doctorant(e) de la thèse :

Baptiste CORBAN

Promotion 2024-2027