Séances de cours associées à Processus stochastiques contrôlés

Processus stochastiques contrôlés

Explore les processus stochastiques contrôlés, en se concentrant sur l'analyse, le comportement et l'optimisation, en utilisant la programmation dynamique pour résoudre les problèmes du monde réel.

Vente d'actifs: Politique de revenus optimale

Explore la dynamique de vente d'actifs, la politique de revenus optimale, les seuils d'acceptation et l'impact sur les prix des produits de base.

Processus de décision de Markov: fondements de l'apprentissage par renforcement

Couvre les processus décisionnels de Markov, leur structure et leur rôle dans l'apprentissage par renforcement.

Problèmes d'arrêt optimal: théorie et applications

Couvre les problèmes d'arrêt optimaux dans les probabilités appliquées et les processus stochastiques, en se concentrant sur la théorie et les applications pratiques.

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, en se concentrant sur la stabilité, la politique stationnaire et les solutions récursives.

Contrôle distribué optimal : GD projeté pour les contrôleurs locaux optimaux

Couvre le contrôle distribué optimal en utilisant Gradient Descent pour atteindre localement des contrôleurs optimaux dans les systèmes à grande échelle.

Le problème du mariage

Explore le problème du mariage, modélisant le processus comme un processus stochastique contrôlé avec des algorithmes de programmation dynamiques pour trouver la politique optimale pour accepter les célibataires.

Problèmes d'horizon infini : formulation et complexité

Couvre les problèmes d'horizon infini dans les processus de probabilité appliquée et stochastiques.

Contrôle LQ Infinite-Horizon : Solution et exemple

Explore Infinite-Horizon Contrôle optimal du Quadratic linéaire (LQ), mettant l'accent sur les méthodes de solution et les exemples pratiques.

Algorithmes d'approximation

Couvre les algorithmes d'approximation pour les problèmes d'optimisation, la relaxation LP et les techniques d'arrondi aléatoire.

Sans titre

Fourier Transform et densités spectrales

Couvre la transformation de Fourier, les densités spectrales, le théorème Wiener-Khinchin et les processus stochastiques.

Contrôle quadratique linéaire (LQ) : preuve de théorème

Couvre la preuve de la formule récursive pour les gains optimaux dans le contrôle LQ sur un horizon fini.

Introduction à l'apprentissage par renforcement: concepts et applications clés

Introduit l'apprentissage par renforcement, couvrant ses définitions, ses applications et ses fondements théoriques, tout en décrivant la structure et les objectifs du cours.

Calcul stochastique: Séance de cours 1

Couvre l'essentiel des probabilités, des algèbres et des probabilités conditionnelles, y compris les processus d'o-algèbre et de Poisson de Borel.

Problème de vente d'actifs

Explore le problème de la vente d'actifs pour maximiser la récompense à long terme sans délai.

Convergence de la chaîne de Markov

Explore la convergence de la chaîne de Markov, en mettant l'accent sur la distribution invariante, la loi des grands nombres et le calcul des récompenses moyennes.

Processus stochastiques : Marche au hasard symétrique

Couvre les propriétés de la marche symétrique aléatoire dans les processus stochastiques.

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, couvrant le remplacement de la machine, les chaînes de Markov, les politiques de contrôle et les problèmes quadratiques linéaires.

Fonctions probabilistes : champs libres et variables aléatoires

Couvre les champs libres et les fonctions probabilistes, en se concentrant sur les variables aléatoires et leurs propriétés.