Discute du gradient des politiques et des méthodes acteurs-critiques, en se concentrant sur les traces d'éligibilité et leur application dans les tâches d'apprentissage de renforcement.
Explore la coordination et l'apprentissage dans des systèmes multiagents distribués, couvrant les lois sociales, l'échange de tâches, la satisfaction des contraintes et les algorithmes de coordination.
Discute de l'avenir de l'enseignement de l'ingénierie en Suisse, en mettant l'accent sur les défis, les opportunités et l'intégration de la technologie dans l'enseignement.
Explore les robots d'entraînement en renforçant l'apprentissage et l'apprentissage de la démonstration, mettant en évidence les défis de l'interaction homme-robot et de la collecte de données.
Explore les applications des agents autonomes dans les drones, la gestion du trafic aérien et la logistique, en se concentrant sur les interactions MAS et les réseaux de transport adaptatifs.
Couvre l'avenir de l'éducation à l'ETH Zrich, en mettant l'accent sur la croissance des étudiants, les demandes de l'industrie et les stratégies d'enseignement innovantes.
Explore l'apprentissage par renforcement profond basé sur des modèles, en se concentrant sur Monte Carlo Tree Search et ses applications dans les stratégies de jeu et les processus décisionnels.
Compare l'apprentissage par renforcement basé sur un modèle et sans modèle, en soulignant les avantages du premier pour s'adapter aux changements de récompense et planifier les actions futures.