Couvre l'utilisation de transformateurs en robotique, en se concentrant sur la perception incarnée et les applications innovantes dans la locomotion humanoïde et l'apprentissage du renforcement.
Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.
S'engager dans la réduction des risques de catastrophe par la préparation, en mettant l'accent sur la coordination et la technologie pour la résilience.
S'insère dans le compromis entre la complexité du modèle et le risque, les limites de généralisation, et les dangers d'un ajustement excessif des classes de fonctions complexes.
Explore les robots d'entraînement en renforçant l'apprentissage et l'apprentissage de la démonstration, mettant en évidence les défis de l'interaction homme-robot et de la collecte de données.
Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.
Explore la modélisation d'une voiture Formula Student sur un simulateur de conduite supervisé par le professeur Colin Jones, y compris un test d'autocross et un défi d'endurance.
Couvre les bases de l'apprentissage du renforcement, y compris les processus décisionnels de Markov et les méthodes de gradient des politiques, et explore les applications du monde réel et les avancées récentes.
Se penche sur les défis de l'apprentissage profond, en explorant la dimensionnalité, les performances et les phénomènes sur-adaptés dans les réseaux neuronaux.
Explore les courbes de double descente et la surparamétrisation dans les modèles d'apprentissage automatique, en soulignant les risques et les avantages.
Couvre les techniques d'apprentissage par renforcement profond pour un contrôle continu, en se concentrant sur les méthodes d'optimisation des politiques proximales et leurs avantages par rapport aux approches de gradient de politique standard.
Fournit une vue d'ensemble de l'apprentissage par renforcement, en se concentrant sur le gradient de politique et les méthodes critiques des acteurs pour les réseaux de neurones artificiels profonds.