Présente la structure du cours et les concepts fondamentaux de l'apprentissage automatique, y compris l'apprentissage supervisé et la régression linéaire.
Couvre l'essentiel de la science des données, y compris le traitement, la visualisation et l'analyse des données, en mettant l'accent sur les compétences pratiques et l'engagement actif.
Fournit une vue d'ensemble des concepts d'apprentissage profond, en se concentrant sur les données, l'architecture du modèle et les défis liés à la gestion de grands ensembles de données.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Explore les implications éthiques du déploiement d'algorithmes d'apprentissage automatique et souligne l'importance de l'équité dans les processus décisionnels.
Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.
Explore les défis et les points de vue de l'apprentissage profond, en mettant l'accent sur le paysage des pertes, la généralisation et l'apprentissage caractéristique.
Explore la méthodologie MODNet pour les prévisions des biens matériels, en mettant l'accent sur la sélection des caractéristiques et l'apprentissage supervisé.
Explore la régression logistique pour la classification binaire, couvrant la modélisation des probabilités, les méthodes d'optimisation et les techniques de régularisation.