Couvre les méthodes de résolution d'équations non linéaires, y compris les méthodes de bisection et de Newton-Raphson, en mettant l'accent sur les critères de convergence et d'erreur.
Introduit l'apprentissage par renforcement, couvrant ses définitions, ses applications et ses fondements théoriques, tout en décrivant la structure et les objectifs du cours.
Présente les bases de l'apprentissage par renforcement, couvrant les états discrets, les actions, les politiques, les fonctions de valeur, les PDM et les politiques optimales.