Passer au contenu principal
Graph
Search
fr
en
Se connecter
Recherche
Tous
Catégories
Concepts
Cours
Séances de cours
MOOCs
Personnes
Exercices
Publications
Start-ups
Unités
Afficher tous les résultats pour
Accueil
Concept
Système de récompense
Science de la nature
Biologie
Biologie cellulaire
Neurotransmission
Graph Chatbot
Séances de cours associées (21)
Connectez-vous pour filtrer par séance de cours
Connectez-vous pour filtrer par séance de cours
Réinitialiser
Méthodes de gradient de politique: Techniques d'apprentissage par renforcement
Fournit un aperçu des méthodes de gradient de politique dans l'apprentissage par renforcement, en se concentrant sur le tour de log-vraisemblance et la transition de l'apprentissage par lots à l'apprentissage en ligne.
Précédent
Page 2 sur 2
Suivant