Séances de cours associées à Problèmes d'horizon infini : formulation et complexité

Explore le problème de la vente d'actifs pour maximiser la récompense à long terme sans délai.

Couvre la prise de décision dans le marketing basé sur le comportement du client pour des stratégies optimales.

Iteration des politiques et programmation linéaire dans les MDP

Discute de l'itération des politiques et des méthodes de programmation linéaire pour résoudre les processus décisionnels de Markov.

Processus de décision de Markov: Techniques de programmation dynamique

Discute des processus décisionnels de Markov et des techniques de programmation dynamique pour résoudre des politiques optimales dans divers scénarios.

Processus de décision de Markov: fondements de l'apprentissage par renforcement

Couvre les processus décisionnels de Markov, leur structure et leur rôle dans l'apprentissage par renforcement.

Séance de cours interactive : Apprentissage du renforcement

Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.

Complexité algorithmique : analyse du temps de déplacement

Couvre la complexité algorithmique et l'analyse du temps de trajet, en se concentrant sur la mesure du temps pris par les algorithmes et l'évaluation de leurs performances.

Résoudre les jeux de parité dans la pratique

Explore les aspects pratiques de la résolution des jeux de parité, y compris les stratégies gagnantes, les algorithmes, la complexité, le déterminisme et les approches heuristiques.

Complexité algorithmique : définition et exemples

Explore l'exactitude de l'algorithme, l'analyse de la complexité dans le pire des cas et la comparaison de l'efficacité en fonction de la taille des entrées.

Mathématiques discrètes: Logique, Structures, Algorithmes

Couvre les bases des mathématiques discrètes, se concentrant sur la logique, les structures et les algorithmes pour les systèmes informatiques.

Algorithmes d'optimisation

Couvre les algorithmes d'optimisation, les propriétés de convergence et la complexité temporelle des séquences et des fonctions.

Les chaînes de Markov : théorie et applications

Couvre la théorie et les applications des chaînes de Markov dans la modélisation de phénomènes aléatoires et la prise de décision sous incertitude.

Accélération de l'itération de valeur : fractionnement de l'opérateur et de l'IDP

Explore l'accélération de l'algorithme d'itération de valeur en utilisant la théorie de contrôle et les techniques de fractionnement de matrice pour atteindre une convergence plus rapide.

Coloriage graphique: théorie et applications

Couvre la théorie et les applications de la coloration graphique, en se concentrant sur les modèles de blocs stochastiques dissortatifs et la coloration plantée.

Apprentissage automatique avancé : apprentissage par renforcement discret

Présente les bases de l'apprentissage par renforcement, couvrant les états discrets, les actions, les politiques, les fonctions de valeur, les PDM et les politiques optimales.

Optimisation du double primaire: méthode extra-gradient

Explore la méthode Extra-Gradient pour l'optimisation Primal-dual, couvrant les problèmes non convexes, les taux de convergence et les performances pratiques.

Jeux de Markov: Concepts et applications dans l'apprentissage par renforcement

Couvre les jeux de Markov, leur dynamique, leurs équilibres et leurs applications dans l'apprentissage par renforcement.

Systèmes linéaires: convergence et méthodes

Explore les systèmes linéaires, la convergence et les méthodes de résolution en mettant l'accent sur les besoins en temps et en mémoire du processeur.

Simon Problem 4: Analyse de l'état quantique et de la complexité

Explore le problème Simon 4, analysant les états quantiques et la complexité des algorithmes.

Complexité des algorithmes

Explore la complexité des algorithmes, analyse l'efficacité et les pires scénarios des algorithmes de tri.