Séance de cours

Vente d'actifs: Politique de revenus optimale

Séances de cours associées (32)

Programmation dynamique : prise de décision optimale

Explore la programmation dynamique pour optimiser les processus de prise de décision au fil du temps, en utilisant des exemples concrets tels que l'extraction de pétrole et la négociation d'actions.

Le problème du mariage

Explore le problème du mariage, modélisant le processus comme un processus stochastique contrôlé avec des algorithmes de programmation dynamiques pour trouver la politique optimale pour accepter les célibataires.

Processus stochastiques contrôlés

Explore les processus stochastiques contrôlés, en se concentrant sur l'analyse, le comportement et l'optimisation, en utilisant la programmation dynamique pour résoudre les problèmes du monde réel.

Processus stochastiques contrôlés

Explore les processus stochastiques contrôlés, la programmation dynamique et le problème de remplacement de la machine.

Processus de décision de Markov: fondements de l'apprentissage par renforcement

Couvre les processus décisionnels de Markov, leur structure et leur rôle dans l'apprentissage par renforcement.

Problèmes d'arrêt optimal: théorie et applications

Couvre les problèmes d'arrêt optimaux dans les probabilités appliquées et les processus stochastiques, en se concentrant sur la théorie et les applications pratiques.

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, en se concentrant sur la stabilité, la politique stationnaire et les solutions récursives.

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, couvrant le remplacement de la machine, les chaînes de Markov, les politiques de contrôle et les problèmes quadratiques linéaires.

Problème de vente d'actifs

Explore le problème de la vente d'actifs pour maximiser la récompense à long terme sans délai.

Le problème du mariage

Explore le problème du mariage, où une mariée doit stratégiquement accepter des prétendants pour maximiser ses chances de choisir le meilleur.

Surprise, curiosité et récompense : une perspective évolutive

Explore la perspective évolutive de la surprise, de la curiosité et de la récompense, en mettant l'accent sur le rôle des signaux de récompense primaires et secondaires.

Problèmes d'horizon infini : formulation et complexité

Couvre les problèmes d'horizon infini dans les processus de probabilité appliquée et stochastiques.

Problèmes de vente d'actifs

Discute des problèmes de vente d'actifs et des politiques de vente optimales basées sur les conditions du marché et les états de résiliation.

Sans titre

Maximisation du profit des producteurs en microéconomie

Explore les conditions de maximisation du profit, les effets de variation des ressources, les voies d'expansion et les interventions de l'État en microéconomie.

Construction Universelle: Algorithme Explication

Explore un algorithme de construction universel simple en utilisant ConsentsObjects, en soulignant sa nature sans journal et l'incertitude de la fin de l'opération.

Apprentissage automatique avancé : apprentissage par renforcement discret

Présente les bases de l'apprentissage par renforcement, couvrant les états discrets, les actions, les politiques, les fonctions de valeur, les PDM et les politiques optimales.

Évaluation des biens environnementaux et des coûts externes : Sécurité routière

Explore la valeur de la vie statistique dans les évaluations de la sécurité routière et de l'environnement.

Compétition imparfaite : cartels et oligopoles

Explore la concurrence imparfaite, les cartels et la dynamique des oligopoles sur les marchés, en analysant les stratégies de tarification et les résultats du marché.

Contrôle distribué optimal : GD projeté pour les contrôleurs locaux optimaux

Couvre le contrôle distribué optimal en utilisant Gradient Descent pour atteindre localement des contrôleurs optimaux dans les systèmes à grande échelle.