Couvre les méthodes de gradient de politique, en mettant l'accent sur l'apprentissage par l'action directe et l'optimisation des récompenses dans l'apprentissage par renforcement.
Discute des méthodes du noyau, en se concentrant sur les surajustements, la sélection des modèles et les fonctions du noyau dans l'apprentissage automatique.
Discute des méthodes du noyau dans l'apprentissage automatique, en se concentrant sur la régression du noyau et les machines vectorielles de support, y compris leurs formulations et applications.