Couvre les bandits multi-armes dans l'apprentissage du renforcement, explorant le compromis entre l'exploration et l'exploitation pour minimiser les regrets.
Explore les méthodes d'estimation de la distribution, les fonctions de remise en forme et l'importance de choisir le bon estimateur pour obtenir des résultats précis.
Explore la régression non paramétrique pour les réseaux, couvrant l'analyse des données d'objets, les graphiques de réseaux, les distances extrinsèques et les projections pratiques.