Séances de cours associées à Programmation dynamique

Multiplication de la chaîne matricielle

Se plonge dans la programmation dynamique en mettant l'accent sur la multiplication de chaînes matricielles et le plus long problème de sous-séquence commune.

Programmation dynamique : Découpe de bâtonnets et transformation

Explore la programmation dynamique à travers la coupe de tiges et les problèmes d'optimisation de changement.

Programmation dynamique : sous-séquence commune la plus longue

Explore la programmation dynamique en mettant l'accent sur le problème de la sous-séquence commune la plus longue et ses solutions efficaces.

Processus stochastiques contrôlés

Explore les processus stochastiques contrôlés, en se concentrant sur l'analyse, le comportement et l'optimisation, en utilisant la programmation dynamique pour résoudre les problèmes du monde réel.

La plus longue sous-séquence commune: Algorithme de programmation dynamique

Explore le concept de sous-séquence commune la plus longue et son algorithme de programmation dynamique, en mettant l'accent sur une sous-structure optimale et une résolution efficace des problèmes.

Vente d'actifs: Politique de revenus optimale

Explore la dynamique de vente d'actifs, la politique de revenus optimale, les seuils d'acceptation et l'impact sur les prix des produits de base.

Problème de vente d'actifs

Explore le problème de la vente d'actifs pour maximiser la récompense à long terme sans délai.

Programmation dynamique : Découpe de tiges et multiplication de chaînes matricielles

Couvre les techniques de programmation dynamique pour résoudre les problèmes de coupe de tige et de multiplication de chaîne matricielle.

Techniques de programmation linéaire dans l'apprentissage par renforcement

Couvre l'approche de programmation linéaire de l'apprentissage par renforcement, en se concentrant sur ses applications et ses avantages dans la résolution des processus décisionnels de Markov.

Processus de décision de Markov: fondements de l'apprentissage par renforcement

Couvre les processus décisionnels de Markov, leur structure et leur rôle dans l'apprentissage par renforcement.

Programmation dynamique : Découpe de tiges et multiplication de chaînes matricielles

Introduit une programmation dynamique en mettant l'accent sur la coupe des tiges et la multiplication de la chaîne matricielle.

Programmation dynamique : nombres de Fibonacci

Explore la programmation dynamique grâce aux nombres de Fibonacci, à la mémorisation et aux applications de coupe de tiges.

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, couvrant le remplacement de la machine, les chaînes de Markov, les politiques de contrôle et les problèmes quadratiques linéaires.

Séance de cours interactive : Apprentissage du renforcement

Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.

Programmation dynamique: Knapsack

Explore la programmation dynamique du problème Knapsack, en discutant des stratégies, des algorithmes, de la dureté du NP et de l'analyse de la complexité temporelle.

Introduction à l'apprentissage par renforcement: concepts et applications clés

Introduit l'apprentissage par renforcement, couvrant ses définitions, ses applications et ses fondements théoriques, tout en décrivant la structure et les objectifs du cours.

Problèmes de vente d'actifs

Discute des problèmes de vente d'actifs et des politiques de vente optimales basées sur les conditions du marché et les états de résiliation.

Récapitulatif de la programmation dynamique

Couvre un récapitulatif de la programmation dynamique et de la stratégie de pari optimale dans un problème de jeu.

Programmation dynamique : multiplication de chaînes matricielles

Explore la programmation dynamique en mettant l'accent sur la multiplication matricielle et l'importance d'une sous-structure optimale.

Processus stochastiques contrôlés

Explore les processus stochastiques contrôlés, la programmation dynamique et le problème de remplacement de la machine.