Offre une introduction complète à la science des données, couvrant Python, Numpy, Pandas, Matplotlib et Scikit-learn, en mettant l'accent sur les exercices pratiques et le travail collaboratif.
Explore les techniques de regroupement de comportement et de réduction de dimensionnalité non supervisées, couvrant des algorithmes comme K-Means, DBSCAN et Gaussian Mixture Model.
Explore les fondamentaux de régression logistique, y compris les fonctions de coût, la régularisation et les limites de classification, avec des exemples pratiques utilisant scikit-learn.
Introduit des techniques de clustering d'apprentissage automatique non supervisées telles que K-means, Gaussian Mixture Models et DBSCAN, expliquant leurs algorithmes et leurs applications.
Explore les arbres de décision pour la classification, l'entropie, le gain d'information, l'encodage à chaud, l'optimisation de l'hyperparamètre et les forêts aléatoires.
Introduit les bases de l'apprentissage automatique, en mettant l'accent sur l'utilisation de Piazza pour les communications liées à la classe et les exercices pratiques en Python.
Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.
Explore les méthodes de clustering K-means et DBSCAN, en discutant des propriétés, des inconvénients, de l'initialisation et de la sélection optimale des clusters.