Introduit l'apprentissage par renforcement, couvrant ses définitions, ses applications et ses fondements théoriques, tout en décrivant la structure et les objectifs du cours.
Explore les défis en matière de contrôle, de sécurité et de coordination pour les systèmes autonomes comme les voitures autonomes, en mettant l'accent sur l'apprentissage sécuritaire et les équilibres Nash.
Explore les agents d'apprentissage profond dans l'apprentissage du renforcement, en mettant l'accent sur les approximations du réseau neuronal et les défis dans la formation des systèmes multiactifs.
Explore l'intelligence, la perception et les applications de l'IA dans les véhicules autonomes, en mettant l'accent sur la pensée rationnelle et l'intelligence sociale.
Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.
Explore l'application de l'apprentissage de renforcement pour enseigner à Pacman à jouer de façon autonome en utilisant les méthodes de gradient de politique et les processus de décision Markov.
Couvre les concepts fondamentaux de l'apprentissage profond et de l'architecture Transformer, en se concentrant sur les réseaux neuronaux, les mécanismes d'attention et leurs applications dans les tâches de modélisation de séquence.
Explore les défis de l'apprentissage profond pour les véhicules autonomes, en mettant l'accent sur la modélisation du comportement social et la prévision de trajectoire réalisable.
Explore la prévision des trajectoires dans les véhicules autonomes, en mettant l'accent sur les modèles d'apprentissage profond pour prédire les trajectoires humaines dans les scénarios de transport socialement conscients.
Couvre les méthodes de prédiction sans modèle dans l'apprentissage par renforcement, en se concentrant sur Monte Carlo et les différences temporelles pour estimer les fonctions de valeur sans connaissance de la dynamique de transition.
Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.
Explore l'IA socialement consciente pour la mobilité des derniers milles, se concentrant sur la compréhension des étiquettes sociales, l'anticipation des comportements et la prévision des mouvements de foule.
Explore l'apprentissage autosupervisé pour les véhicules autonomes, en dérivant des étiquettes de données elles-mêmes et en discutant de ses applications et de ses défis.