Passer au contenu principal
Séance de cours

Apprentissage par renforcement profond: fonction de gradient et de valeur de la politique