Explore l'apprentissage par renforcement profond basé sur des modèles, en se concentrant sur Monte Carlo Tree Search et ses applications dans les stratégies de jeu et les processus décisionnels.
Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.
Explorer la résolution Connect Four en utilisant la théorie du jeu et l'optimisation des algorithmes, en comparant minimax, taille alpha-bêta, et recherche d'arbre Monte-Carlo.
Couvre la planification avec des adversaires, des algorithmes de recherche heuristique et des stratégies pour les jeux avec le hasard, en soulignant l'importance des agents délibératifs.
Explorer la résolution Connect Four en utilisant des algorithmes de théorie de jeu et compare la taille Alpha-Beta avec la recherche d'arbre Monte-Carlo.
Couvre MuZero, un modèle qui apprend à prédire les récompenses et les actions de manière itérative, réalisant des performances de pointe dans les jeux de société et les jeux vidéo Atari.