Couvre les décisions d'investissement, en se concentrant sur les rentes, les coûts d'actualisation et l'évaluation de la rentabilité par la valeur actualisée nette et les taux de rendement internes.
Discute du gradient des politiques et des méthodes acteurs-critiques, en se concentrant sur les traces d'éligibilité et leur application dans les tâches d'apprentissage de renforcement.
Discute des processus décisionnels de Markov et des techniques de programmation dynamique pour résoudre des politiques optimales dans divers scénarios.
Couvre le concept d'actualisation des valeurs futures dans les calculs financiers et ses implications pour les investissements environnementaux et le changement climatique.
Explore l'analyse des choix d'investissement, couvrant l'actualisation, l'évaluation des risques et les méthodes d'évaluation financière telles que la valeur actualisée nette et les périodes de remboursement.
Couvre l'actualisation en économie de l'environnement, en mettant l'accent sur l'arbitrage intertemporel et l'évaluation des coûts et des avantages au fil du temps.
Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.
Explore l'application de l'apprentissage de renforcement pour enseigner à Pacman à jouer de façon autonome en utilisant les méthodes de gradient de politique et les processus de décision Markov.
Explique les concepts de valeur présents et futurs dans l'évaluation des investissements, en mettant l'accent sur leur calcul et leur importance dans la prise de décision financière.
Couvre la prise de décision financière par l'analyse coûts-avantages dans les projets publics, en mettant l'accent sur la viabilité de l'investissement et les implications des taux d'intérêt.