Déplacez-vous dans le problème de demande linéaire, les perturbations infinitésimales, les plans de transport, et le théorème principal à partir de 2018.

Le problème du transbordement : les conditions d’optimalité

Couvre les conditions optimales pour résoudre efficacement les problèmes de transbordement.

Renforcement de l'apprentissage : Q-Learning

Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.

Iteration des politiques et programmation linéaire dans les MDP

Discute de l'itération des politiques et des méthodes de programmation linéaire pour résoudre les processus décisionnels de Markov.

Modèle de consommation de dotation stochastique

Couvre le modèle de consommation de dotation stochastique, la transformation log-linéaire, la solution de réponse impulsionnelle et les codes Matlab.

Programmation dynamique : Optimisation de portefeuille

Explore la programmation dynamique pour optimiser les choix de portefeuille et la théorie de la tarification des actifs.

Choix de portefeuille dynamique : dynamique de la richesse et équation HJB

Couvre le choix dynamique du portefeuille, la dynamique de la richesse, l'équation HJB et les puzzles de tarification des actifs.

Apprentissage par renforcement : horizon en une étape (problèmes de bande)

Couvre les problèmes de bandits dans l'apprentissage par renforcement, en se concentrant sur les jeux d'horizon en une étape et les valeurs Q.

Transport optimal : théorie et applications

Couvre la théorie et les applications du transport optimal, en se concentrant sur la convolution infimale et les potentiels de Kantorovich.

Page 2 sur 2