Concept

Apprentissage par renforcement

Séances de cours associées (29)

Agents d'apprentissage profond : Renforcement de l'apprentissage

Explore les agents d'apprentissage profond dans l'apprentissage du renforcement, en mettant l'accent sur les approximations du réseau neuronal et les défis dans la formation des systèmes multiactifs.

Renforcement de l'apprentissage : Q-Learning

Couvre l'apprentissage Q en renforçant l'apprentissage, en explorant les valeurs d'action, les politiques et l'impact sociétal des algorithmes.

Agents d'apprentissage: Tradeoff Exploration-Exploitation

Explore le compromis exploration-exploitation dans l'apprentissage des effets inconnus des actions en utilisant des bandits multi-armés et Q-learning.

Véhicules autonomes: prévision de trajectoire et comportement social

Explore les défis de l'apprentissage profond pour les véhicules autonomes, en mettant l'accent sur la modélisation du comportement social et la prévision de trajectoire réalisable.

Perception : Approches fondées sur les données

Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.

Apprentissage par renforcement: gradient de politique et méthodes critiques pour les acteurs

Fournit une vue d'ensemble de l'apprentissage par renforcement, en se concentrant sur le gradient de politique et les méthodes critiques des acteurs pour les réseaux de neurones artificiels profonds.

Prévisions de trajectoire dans les véhicules autonomes

Explore la prévision des trajectoires dans les véhicules autonomes, en mettant l'accent sur les modèles d'apprentissage profond pour prédire les trajectoires humaines dans les scénarios de transport socialement conscients.

Bases d'apprentissage de renforcement

Introduit les bases de l'apprentissage par renforcement, y compris les politiques d'apprentissage Q et epsilon-greedy.

Éléments du renforcement de l'apprentissage

Introduit les éléments fondamentaux de l'apprentissage du renforcement et démontre leur application avec le système Acrobot.

Apprentissage autosupervisé pour les véhicules autonomes

Explore l'apprentissage autosupervisé pour les véhicules autonomes, en dérivant des étiquettes de données elles-mêmes et en discutant de ses applications et de ses défis.

Acquérir des données pour l'apprentissage

Explore les robots d'entraînement en renforçant l'apprentissage et l'apprentissage de la démonstration, mettant en évidence les défis de l'interaction homme-robot et de la collecte de données.

Apprentissage par renforcement profond basé sur des modèles: Monte Carlo Tree Search

Explore l'apprentissage par renforcement profond basé sur des modèles, en se concentrant sur Monte Carlo Tree Search et ses applications dans les stratégies de jeu et les processus décisionnels.

Introduction à l'apprentissage par renforcement: concepts et applications

Introduit l'apprentissage par renforcement, couvrant ses concepts, ses applications et ses algorithmes clés.

Méthodes de dégradé de politique: exemple dacteur binaire

Introduit des méthodes de gradient de politique en utilisant un exemple simple d'un seul neurone avec une sortie binaire.

Acquérir des données pour l'apprentissage : approches et défis modernes

Explore les approches et les défis modernes en matière d'acquisition de données pour l'apprentissage de contrôleurs optimaux au moyen de démonstrations et de méthodes axées sur les données.

Démarrage et alignement

Explore l'incitation, l'alignement et les capacités des grands modèles de langage pour les tâches de traitement du langage naturel.

La sécurité de l'apprentissage pour les systèmes autonomes

Explore les défis en matière de contrôle, de sécurité et de coordination pour les systèmes autonomes comme les voitures autonomes, en mettant l'accent sur l'apprentissage sécuritaire et les équilibres Nash.

Différents types d'apprentissage

Couvre l'apprentissage des neurorobotiques supervisé, non supervisé et renforcé.

Apprentissage continu du renforcement : apprentissage automatique avancé

Explore les défis d'apprentissage en renforcement continu de l'état, l'estimation de la fonction de valeur, les gradients des politiques et l'apprentissage des politiques par l'exploration pondérée.

Concepts d'apprentissage par renforcement

Couvre les concepts clés de l'apprentissage par renforcement, des réseaux neuronaux, du clustering et de l'apprentissage non supervisé, en mettant l'accent sur leurs applications et leurs défis.