Séance de cours

Programmation dynamique : contrôle optimal

Séances de cours associées (32)

Contrôle quadratique linéaire (LQ) : preuve de théorème

Couvre la preuve de la formule récursive pour les gains optimaux dans le contrôle LQ sur un horizon fini.

Explore la programmation dynamique pour un contrôle optimal, en se concentrant sur la stabilité, la politique stationnaire et les solutions récursives.

Contrôle quadratique linéaire optimal : analyse et solution

Explore le contrôle quadratique optimal linéaire, analyse les coûts et présente la solution au problème FH-LQ.

Contrôle LQ Infinite-Horizon : Solution et exemple

Explore Infinite-Horizon Contrôle optimal du Quadratic linéaire (LQ), mettant l'accent sur les méthodes de solution et les exemples pratiques.

Séance de cours interactive : Apprentissage du renforcement

Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.

Apprentissage automatique avancé : apprentissage par renforcement discret

Présente les bases de l'apprentissage par renforcement, couvrant les états discrets, les actions, les politiques, les fonctions de valeur, les PDM et les politiques optimales.

Contrôle prédictif du modèle non linéaire

Explore le contrôle prédictif du modèle non linéaire, couvrant la stabilité, l'optimalité, les pièges et les exemples.

Processus de décision de Markov: fondements de l'apprentissage par renforcement

Couvre les processus décisionnels de Markov, leur structure et leur rôle dans l'apprentissage par renforcement.

Contrôle optimal stochastique: Théorème de Martingale

Explore le contrôle optimal stochastique, mettant l'accent sur la consommation et l'investissement optimaux, le théorème de représentation de Martingale et le théorème de vérification.

Vente d'actifs: Politique de revenus optimale

Explore la dynamique de vente d'actifs, la politique de revenus optimale, les seuils d'acceptation et l'impact sur les prix des produits de base.

Stabilité de l'ODE

Explore la stabilité des équations différentielles ordinaires, en se concentrant sur la dépendance des solutions, les données critiques, la linéarisation et le contrôle des systèmes non linéaires.

Conception de contrôle LQR distribuée

Introduit une conception LQR distribuée sous-optimale pour les systèmes couplés physiquement avec des garanties de stabilité et des comparaisons de simulation.

Stabilité : pôles, zéros et contrôle

Couvre la stabilité, les pôles, les zéros et le contrôle dans les systèmes dynamiques, en soulignant l'importance de l'observabilité.

Contrôle multivariable: Conception du poids et analyse de stabilité

Explore la conception de poids et l'analyse de stabilité dans les systèmes de contrôle multivariables, en mettant l'accent sur la théorie Lyapunov et la stabilité LQR.

Contrôle optimal : régulation quadratique linéaire

Explore la régulation quadratique linéaire pour un contrôle optimal des systèmes linéaires, en se concentrant sur la minimisation d'une fonction de coût quadratique pour déplacer l'état du système vers zéro.

Problème de vente d'actifs

Explore le problème de la vente d'actifs pour maximiser la récompense à long terme sans délai.

Programmation dynamique : prise de décision optimale

Explore la programmation dynamique pour optimiser les processus de prise de décision au fil du temps, en utilisant des exemples concrets tels que l'extraction de pétrole et la négociation d'actions.

Iteration des politiques et programmation linéaire dans les MDP

Discute de l'itération des politiques et des méthodes de programmation linéaire pour résoudre les processus décisionnels de Markov.

Stratégie marketing optimale

Couvre la prise de décision dans le marketing basé sur le comportement du client pour des stratégies optimales.

Processus stochastiques contrôlés

Explore les processus stochastiques contrôlés, en se concentrant sur l'analyse, le comportement et l'optimisation, en utilisant la programmation dynamique pour résoudre les problèmes du monde réel.