Séance de cours

Processus stochastiques contrôlés

Séances de cours associées (30)

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, en se concentrant sur la stabilité, la politique stationnaire et les solutions récursives.

Modèles de diffusion

Explore les modèles de diffusion, en mettant l'accent sur la production d'échantillons provenant d'une distribution et l'importance de la dénigrement dans le processus.

Introduction à l'apprentissage par renforcement: concepts et applications clés

Introduit l'apprentissage par renforcement, couvrant ses définitions, ses applications et ses fondements théoriques, tout en décrivant la structure et les objectifs du cours.

Processus de décision de Markov: fondements de l'apprentissage par renforcement

Couvre les processus décisionnels de Markov, leur structure et leur rôle dans l'apprentissage par renforcement.

Transport optimal : la dualité Kantorovich

Couvre le transport optimal et la dualité Kantorovich dans les problèmes de distribution de la vie réelle.

Algorithmes d'approximation

Couvre les algorithmes d'approximation pour les problèmes d'optimisation, la relaxation LP et les techniques d'arrondi aléatoire.

Processus stochastiques contrôlés

Explore les processus stochastiques contrôlés, la programmation dynamique et le problème de remplacement de la machine.

Erreur de généralisation

Explore l'erreur de généralisation dans l'apprentissage automatique, en se concentrant sur la distribution des données et l'impact des hypothèses.

Définir la couverture : Integrality Gap

Explore le concept d'écart d'intégralité dans les algorithmes de couverture et de pondérations multiplicatives.

Méthodes d'optimisation : discussion théorique

Explore les méthodes d'optimisation, y compris les problèmes sans contraintes, la programmation linéaire et les approches heuristiques.

Les espaces de Sobolev dans les dimensions supérieures

Explore les espaces de Sobolev dans les dimensions supérieures, en discutant des dérivés, des propriétés et des défis avec continuité.

Programmation dynamique : prise de décision optimale

Explore la programmation dynamique pour optimiser les processus de prise de décision au fil du temps, en utilisant des exemples concrets tels que l'extraction de pétrole et la négociation d'actions.

Accélération de l'itération de valeur : fractionnement de l'opérateur et de l'IDP

Explore l'accélération de l'algorithme d'itération de valeur en utilisant la théorie de contrôle et les techniques de fractionnement de matrice pour atteindre une convergence plus rapide.

Sparsest Cut : le théorème de Bourgain

Explore le théorème de Bourgain sur la coupe la plus clairsemée dans les graphes, en mettant l'accent sur la sémimétrie et l'optimisation des coupes.

Contrôle LQ Infinite-Horizon : Solution et exemple

Explore Infinite-Horizon Contrôle optimal du Quadratic linéaire (LQ), mettant l'accent sur les méthodes de solution et les exemples pratiques.

Deep Learning Modus Operandi

Explore les avantages des réseaux plus profonds dans l'apprentissage profond et l'importance de la surparamétrie et de la généralisation.

Méthode de l'élément fini : Solutions faibles

Couvre les solutions faibles dans la méthode des éléments finis, en mettant l'accent sur la continuité et l'inégalité Cauchy-Schwarz.

Contrôle prédictif du modèle non linéaire

Explore le contrôle prédictif du modèle non linéaire, couvrant la stabilité, l'optimalité, les pièges et les exemples.

Markov Chains: Probabilités de transition

Explore les chaînes de Markov, les matrices de transition, la distribution et les promenades aléatoires.

Vente d'actifs: Politique de revenus optimale

Explore la dynamique de vente d'actifs, la politique de revenus optimale, les seuils d'acceptation et l'impact sur les prix des produits de base.