Séances de cours associées à Introduction à l'apprentissage par renforcement: concepts et applications clés

Processus de décision de Markov: fondements de l'apprentissage par renforcement

Couvre les processus décisionnels de Markov, leur structure et leur rôle dans l'apprentissage par renforcement.

Explore les processus stochastiques contrôlés, en se concentrant sur l'analyse, le comportement et l'optimisation, en utilisant la programmation dynamique pour résoudre les problèmes du monde réel.

Acquérir des données pour l'apprentissage

Explore les robots d'entraînement en renforçant l'apprentissage et l'apprentissage de la démonstration, mettant en évidence les défis de l'interaction homme-robot et de la collecte de données.

Séance de cours interactive : Apprentissage du renforcement

Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.

Jeux de Markov: Concepts et applications dans l'apprentissage par renforcement

Couvre les jeux de Markov, leur dynamique, leurs équilibres et leurs applications dans l'apprentissage par renforcement.

Apprentissage et contrôle des systèmes complexes

Explore l'apprentissage et le contrôle des systèmes complexes, en abordant les défis et les possibilités en matière de technologie et de recherche interdisciplinaire.

Prédiction sans modèle dans l'apprentissage par renforcement: méthodes clés

Couvre les méthodes de prédiction sans modèle dans l'apprentissage par renforcement, en se concentrant sur Monte Carlo et les différences temporelles pour estimer les fonctions de valeur sans connaissance de la dynamique de transition.

Accélération de l'itération de valeur : fractionnement de l'opérateur et de l'IDP

Explore l'accélération de l'algorithme d'itération de valeur en utilisant la théorie de contrôle et les techniques de fractionnement de matrice pour atteindre une convergence plus rapide.

Renforcement de l'apprentissage pour Pacman

Couvre l'application de l'apprentissage du renforcement pour enseigner à Pacman de jouer de manière autonome par essai et erreur.

Introduction à l'apprentissage par renforcement: concepts et applications

Introduit l'apprentissage par renforcement, couvrant ses concepts, ses applications et ses algorithmes clés.

Acquérir des données pour l'apprentissage : approches et défis modernes

Explore les approches et les défis modernes en matière d'acquisition de données pour l'apprentissage de contrôleurs optimaux au moyen de démonstrations et de méthodes axées sur les données.

Apprentissage automatique avancé : apprentissage par renforcement discret

Présente les bases de l'apprentissage par renforcement, couvrant les états discrets, les actions, les politiques, les fonctions de valeur, les PDM et les politiques optimales.

Optimisation décentralisée

Explore l'optimisation décentralisée dans l'apprentissage automatique, en mettant l'accent sur la robustesse, la confidentialité et l'équité dans l'apprentissage collaboratif.

Deep Learning Blocks Buildings

Couvre les tenseurs, les fonctions de perte, l'autograde et les couches de convolution dans l'apprentissage profond.

Réseaux profonds et convolutifs : généralisation et optimisation

Explore les réseaux profonds et convolutifs, couvrant la généralisation, l'optimisation et les applications pratiques dans l'apprentissage automatique.

Perception : Approches fondées sur les données

Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.

La robotique perceptuelle : intégration de la vision et de l’action

Couvre l'intégration de la perception visuelle et des actions robotiques dans l'IA incarnée.

L'apprentissage sécuritaire en robotique : Quo Vadis?

Explore l'apprentissage sécuritaire en robotique, couvrant l'état de l'art, les défis ouverts et la vision sur le terrain, soulignant l'importance de la collaboration interdisciplinaire.

Apprentissage par renforcement: gradient de politique et méthodes critiques pour les acteurs

Fournit une vue d'ensemble de l'apprentissage par renforcement, en se concentrant sur le gradient de politique et les méthodes critiques des acteurs pour les réseaux de neurones artificiels profonds.

Manipuler des objets avec des robots : intégration vision-langage

Explique comment les robots manipulent des objets en utilisant des instructions en langage naturel et intègre des modèles de langage de vision pour améliorer les performances.