Temporal difference learning

Applied sciences
Information engineering
Apprentissage automatique
Apprentissage par renforcement

À propos
Confidentialité
Mentions légales

Graph Chatbot

Séances de cours associées (29)

Connectez-vous pour filtrer par séance de cours

Apprentissage continu du renforcement : apprentissage automatique avancé

Explore les défis d'apprentissage en renforcement continu de l'état, l'estimation de la fonction de valeur, les gradients des politiques et l'apprentissage des politiques par l'exploration pondérée.

N-step TD Methods: SARSA et SARSA attendu

Explore les méthodes n-step TD dans l'apprentissage par renforcement, améliorant le flux d'informations et la précision de l'estimation.

Apprentissage par renforcement: gradient de politique et méthodes critiques pour les acteurs

Fournit une vue d'ensemble de l'apprentissage par renforcement, en se concentrant sur le gradient de politique et les méthodes critiques des acteurs pour les réseaux de neurones artificiels profonds.

Stratégies d'exploration des robots de longue durée

Explore les stratégies d'exploration de robots à longue distance dans des espaces d'action continue pour la recherche multi-objets.

Minimisation des risques à partir de données recueillies adaptativement

Explore la minimisation des risques à partir de données recueillies adaptativement avec des garanties pour l'apprentissage des politiques et l'importance des stratégies d'exploration.

TD Learning : Apprentissage par différence temporelle

Couvre l'apprentissage par différence temporelle, les valeurs V, les valeurs d'état et les méthodes TD dans l'apprentissage par renforcement.

Apprentissage des différences temporelles

Couvertures Renforcement Théorie de l'apprentissage, Q-Learning, et horizons multi-étapes.

Exploration et exploitation

Couvre la théorie du renforcement de l'apprentissage, en mettant l'accent sur le dilemme de l'exploration et de l'exploitation et sur les stratégies visant à équilibrer l'exploration et l'exploitation.

Apprentissage du renforcement : Traces d'admissibilité

Explore l'apprentissage du renforcement, en mettant l'accent sur la mise à jour des valeurs d'action antérieures le long de la trajectoire à l'aide de l'algorithme SARSA.

Renforcement de l'apprentissage : Q-Learning

Couvre Q-Learning, un algorithme d'apprentissage par renforcement sans modèle, et son application à Tic-Tac-Toe avec des exemples et des quiz.

Dégradation des politiques et méthodes critiques pour les acteurs : les traces de l’admissibilité expliquées

Discute du gradient des politiques et des méthodes acteurs-critiques, en se concentrant sur les traces d'éligibilité et leur application dans les tâches d'apprentissage de renforcement.

Acteur-Critique Architecture et Avantage-Acteur-Critique

Explore les réseaux acteur-critique et la méthode critique acteur avantage pour optimiser les paramètres pour maximiser le rendement.

Apprentissage par renforcement : algorithme SARSA

Explore l'algorithme SARSA pour l'apprentissage par renforcement, en mettant l'accent sur la mise à jour des valeurs Q et l'importance de l'exploration dans l'apprentissage par récompenses.

Modélisation de l'espace d'entrée

Explore la modélisation d'espaces d'entrée continus dans l'apprentissage par renforcement à l'aide de réseaux de neurones et de fonctions de base radiales.

Apprentissage par renforcement : TD Learning et les variantes de la LEP

Discute de l'apprentissage par renforcement, en se concentrant sur l'apprentissage par différence temporelle et les variations de l'algorithme SARSA.

Apprentissage et contrôle en toute sécurité

Explore l'apprentissage sûr, le contrôle, la coordination multi-agents, et la convergence d'équilibre Nash dans les systèmes intelligents.

Théorie de l'apprentissage du renforcement: question introductive

Couvre la théorie du renforcement de l'apprentissage, explorant le dilemme de l'exploration/exploitation et les espaces d'état/d'action continus.

Apprentissage par renforcement: Diagrammes de sauvegarde

Présente le diagramme de sauvegarde en tant que représentation graphique clé dans l'apprentissage par renforcement.

Éléments du renforcement de l'apprentissage

Introduit les éléments fondamentaux de l'apprentissage du renforcement et démontre leur application avec le système Acrobot.

Renforcement de l'apprentissage : Q-Learning

Couvre l'apprentissage Q en renforçant l'apprentissage, en explorant les valeurs d'action, les politiques et l'impact sociétal des algorithmes.

Page 1 sur 2