Apprentissage par renforcement profond: fonction de gradient et de valeur de la politique

À propos
Confidentialité
Mentions légales

Graph Chatbot

Séances de cours associées (29)

Méthodes de dégradé de politique: exemple dacteur binaire

Introduit des méthodes de gradient de politique en utilisant un exemple simple d'un seul neurone avec une sortie binaire.

Renforcement de l'apprentissage : Q-Learning

Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.

Deep Learning III

Plongez dans l'optimisation du deep learning, les défis, les variantes SGD, les points critiques, les réseaux surparamétrés et les méthodes adaptatives.

Les principes fondamentaux de l'apprentissage profond

Couvre les fondamentaux de l'apprentissage profond, des neurones artificiels aux réseaux modernes.

Machine Learning for Solving PDEs: Méthode de caractéristiques aléatoires

Explore la méthode de fonction aléatoire pour résoudre les PDE à l'aide d'algorithmes d'apprentissage automatique pour approximer efficacement les fonctions à haute dimension.

Deep Learning : réseaux neuronaux convolutifs

Présente les réseaux neuronaux convolutifs, en expliquant leur architecture, leur processus de formation et leurs applications dans les tâches de segmentation sémantique.

Réseaux neuronaux profonds

Couvre l'algorithme de rétro-propagation pour les réseaux neuronaux profonds et l'importance de la localité dans CNN.

Comprendre l'apprentissage automatique : des modèles parfaitement solubles

Explore la mécanique statistique de l'apprentissage, en mettant l'accent sur les mystères des réseaux neuronaux et les défis informatiques.

Joueur IA : D4

Explore l'apprentissage par renforcement dans l'IA pour maîtriser les jeux à l'aide de réseaux neuronaux.

Page 2 sur 2