Séances de cours associées à Comparaison des traces de SARSA et d'admissibilité

Apprentissage des différences temporelles

Couvertures Renforcement Théorie de l'apprentissage, Q-Learning, et horizons multi-étapes.

Couvre les calculs intertemporels, l'arbitrage du propriétaire foncier et l'évaluation de la rentabilité en économie immobilière.

Décisions d’investissement : rentes et coûts d’actualisation

Couvre les décisions d'investissement, en se concentrant sur les rentes, les coûts d'actualisation et l'évaluation de la rentabilité par la valeur actualisée nette et les taux de rendement internes.

Dégradation des politiques et méthodes critiques pour les acteurs : les traces de l’admissibilité expliquées

Discute du gradient des politiques et des méthodes acteurs-critiques, en se concentrant sur les traces d'éligibilité et leur application dans les tâches d'apprentissage de renforcement.

Processus de décision de Markov: Techniques de programmation dynamique

Discute des processus décisionnels de Markov et des techniques de programmation dynamique pour résoudre des politiques optimales dans divers scénarios.

Abrogation des valeurs futures : implications économiques

Couvre le concept d'actualisation des valeurs futures dans les calculs financiers et ses implications pour les investissements environnementaux et le changement climatique.

Réduction : Valeur actuelle et générations futures

Examiner l'impact de l'actualisation sur les générations futures, la prise de décisions et les compromis en matière d'investissement public.

Analyse des choix d'investissement

Explore l'analyse des choix d'investissement, couvrant l'actualisation, l'évaluation des risques et les méthodes d'évaluation financière telles que la valeur actualisée nette et les périodes de remboursement.

Introduction à l'apprentissage par renforcement: concepts et applications

Introduit l'apprentissage par renforcement, couvrant ses concepts, ses applications et ses algorithmes clés.

Réduction : Arbitrage intertemporel et évaluation financière

Couvre l'actualisation en économie de l'environnement, en mettant l'accent sur l'arbitrage intertemporel et l'évaluation des coûts et des avantages au fil du temps.

Réduction: Exercices

Couvre les exercices sur les calculs d'actualisation en utilisant différents taux dans Excel.

Séance de cours interactive : Apprentissage du renforcement

Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.

Apprentissage par renforcement : TD Learning et les variantes de la LEP

Discute de l'apprentissage par renforcement, en se concentrant sur l'apprentissage par différence temporelle et les variations de l'algorithme SARSA.

Renforcement de l'apprentissage pour Pacman

Explore l'application de l'apprentissage de renforcement pour enseigner à Pacman à jouer de façon autonome en utilisant les méthodes de gradient de politique et les processus de décision Markov.

Iteration des politiques et programmation linéaire dans les MDP

Discute de l'itération des politiques et des méthodes de programmation linéaire pour résoudre les processus décisionnels de Markov.

Problèmes d'horizon infini : formulation et complexité

Couvre les problèmes d'horizon infini dans les processus de probabilité appliquée et stochastiques.

Principes de finance: rentes, taux d'intérêt et valeur actuelle

Couvre les rentes, les taux d'intérêt, la valeur actuelle et la valeur temporelle de l'argent.

Valorisation des investissements : concepts de valeur actuelle et future

Explique les concepts de valeur présents et futurs dans l'évaluation des investissements, en mettant l'accent sur leur calcul et leur importance dans la prise de décision financière.

Traces dans les algorithmes de gradient de politique

Plonge dans l'émergence de traces d'éligibilité dans les algorithmes de gradient de politique, rendant l'apprentissage rapide et efficace.

Prise de décision financière : analyse coûts-avantages dans les projets

Couvre la prise de décision financière par l'analyse coûts-avantages dans les projets publics, en mettant l'accent sur la viabilité de l'investissement et les implications des taux d'intérêt.