Game Synthesis & Control

Responsables : Anca Muscholl et Guillaume Lagarde

Ce cours du S9 est obligatoire pour VL et en option pour AM. Il vaut 6ECTS.

Partie 1 (Anca Muscholl):

La première partie du cours est une introduction à la théorie des jeux pour la vérification et la synthèse. La synthèse de systèmes ouverts ou de contrôleurs part du principe d'un système réactif, qui doit intéragir avec son environnement. Les deux entités - système et environnement - sont vues en tant que 2 joueurs antagonistes. On abordera différents types de jeux : jeux à deux joueurs sur des arènes finies, jeux pour la synthèse de contrôleurs, et jeux distribués.

Partie 2 (Guillaume Lagarde):

Dans cette partie, nous explorerons les bases théoriques de l'apprentissage par renforcement, un framework extrêmement puissant de l'intelligence artificielle permettant aux machines d'acquérir des connaissances et de prendre des décisions en interagissant avec leur environnement. Nous explorerons en détail les concepts fondamentaux tels que le problème des bandits manchots, les processus de décision markoviens, les compromis entre exploration et exploitation, le Q-learning, etc. ainsi que des techniques avancées telles que l'approximation de fonction et le Deep Q-learning. À la fin de ce cours, vous aurez entre autres acquis les compétences nécessaires pour comprendre AlphaGo, première IA à surpasser l'humain au jeu de go.