Séance de cours

Apprentissage par renforcement: Exploration, Attribution de crédit, TRPO, PPO

Séances de cours associées (31)

Discute des défauts de maintenance intelligente, Denoising Sparse Wavelet Network, Koopman operator theory et Graph Neural Networks.

Transformers en robotique : applications et innovations

Couvre l'utilisation de transformateurs en robotique, en se concentrant sur la perception incarnée et les applications innovantes dans la locomotion humanoïde et l'apprentissage du renforcement.

Séance de cours interactive : Apprentissage du renforcement

Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.

Programmation du robot Thymio

Plonge dans des méthodes de programmation alternatives pour le robot Thymio et l'intégration d'un Raspberry Pi pour des capacités améliorées.

Réduction des risques de catastrophe: Préparation et technologie

S'engager dans la réduction des risques de catastrophe par la préparation, en mettant l'accent sur la coordination et la technologie pour la résilience.

La généralisation dans l'apprentissage profond

Explore la généralisation dans l'apprentissage profond, couvrant la complexité du modèle, le biais implicite, et le phénomène de double descente.

La généralisation dans l'apprentissage profond

S'insère dans le compromis entre la complexité du modèle et le risque, les limites de généralisation, et les dangers d'un ajustement excessif des classes de fonctions complexes.

Apprendre avec les réseaux neuronaux profonds

Explore le succès et les défis de l'apprentissage profond, y compris le suréquipement, la généralisation et l'impact sur divers domaines.

Présentation de la gamification

Explore la gamification, la ludification et l'éducation en éducation numérique, y compris l'apprentissage basé sur les jeux et les jeux sérieux.

Acquérir des données pour l'apprentissage

Explore les robots d'entraînement en renforçant l'apprentissage et l'apprentissage de la démonstration, mettant en évidence les défis de l'interaction homme-robot et de la collecte de données.

Perception : Approches fondées sur les données

Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.

Modélisation d'une voiture étudiante de Formule sur un simulateur de conduite

Explore la modélisation d'une voiture Formula Student sur un simulateur de conduite supervisé par le professeur Colin Jones, y compris un test d'autocross et un défi d'endurance.

Renforcement de l'apprentissage : bases et applications

Couvre les bases de l'apprentissage du renforcement, y compris les processus décisionnels de Markov et les méthodes de gradient des politiques, et explore les applications du monde réel et les avancées récentes.

La malédiction de la dimensionnalité dans l'apprentissage profond

Se penche sur les défis de l'apprentissage profond, en explorant la dimensionnalité, les performances et les phénomènes sur-adaptés dans les réseaux neuronaux.

Algorithmes gradués dans l'apprentissage à haute dimension

Fournit des informations sur les algorithmes basés sur les gradients, les mystères d'apprentissage profond, et les défis des problèmes non convexes.

Courbes de double descente : surparamétrisation

Explore les courbes de double descente et la surparamétrisation dans les modèles d'apprentissage automatique, en soulignant les risques et les avantages.

Introduction à l'apprentissage par renforcement: concepts et applications

Introduit l'apprentissage par renforcement, couvrant ses concepts, ses applications et ses algorithmes clés.

Apprentissage par renforcement profond: techniques d'optimisation des politiques proximales

Couvre les techniques d'apprentissage par renforcement profond pour un contrôle continu, en se concentrant sur les méthodes d'optimisation des politiques proximales et leurs avantages par rapport aux approches de gradient de politique standard.

Méthodes de dégradé de politique: exemple dacteur binaire

Introduit des méthodes de gradient de politique en utilisant un exemple simple d'un seul neurone avec une sortie binaire.

Apprentissage par renforcement: gradient de politique et méthodes critiques pour les acteurs

Fournit une vue d'ensemble de l'apprentissage par renforcement, en se concentrant sur le gradient de politique et les méthodes critiques des acteurs pour les réseaux de neurones artificiels profonds.