Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.
Explore les réseaux neuronaux à deux couches et la rétropropagation pour l'apprentissage des espaces de fonctionnalités et l'approximation des fonctions continues.
Couvre un cours intensif sur l'apprentissage profond, y compris le Mark I Perceptron, les réseaux neuronaux, les algorithmes d'optimisation et les aspects de formation pratique.
Introduit les bases de l'apprentissage profond, couvrant les réseaux neuronaux, les CNN, les couches spéciales, l'initialisation du poids, le prétraitement des données et la régularisation.