Explore les processus stochastiques contrôlés, en se concentrant sur l'analyse, le comportement et l'optimisation, en utilisant la programmation dynamique pour résoudre les problèmes du monde réel.
Couvre les problèmes d'arrêt optimaux dans les probabilités appliquées et les processus stochastiques, en se concentrant sur la théorie et les applications pratiques.
Explore la programmation dynamique pour un contrôle optimal, en se concentrant sur la stabilité, la politique stationnaire et les solutions récursives.
Couvre le contrôle distribué optimal en utilisant Gradient Descent pour atteindre localement des contrôleurs optimaux dans les systèmes à grande échelle.
Explore le problème du mariage, modélisant le processus comme un processus stochastique contrôlé avec des algorithmes de programmation dynamiques pour trouver la politique optimale pour accepter les célibataires.
Introduit l'apprentissage par renforcement, couvrant ses définitions, ses applications et ses fondements théoriques, tout en décrivant la structure et les objectifs du cours.
Explore la convergence de la chaîne de Markov, en mettant l'accent sur la distribution invariante, la loi des grands nombres et le calcul des récompenses moyennes.
Explore la programmation dynamique pour un contrôle optimal, couvrant le remplacement de la machine, les chaînes de Markov, les politiques de contrôle et les problèmes quadratiques linéaires.