Concept

Scikit-learn

Séances de cours associées (29)

Introduction générale à la science des données

Offre une introduction complète à la science des données, couvrant Python, Numpy, Pandas, Matplotlib et Scikit-learn, en mettant l'accent sur les exercices pratiques et le travail collaboratif.

L'essentiel de la science des données : Python, Numpy, Pandas et Scikit-learn

Couvre l'essentiel de Data Science en utilisant Python, Numpy, Pandas et Scikit-learn, y compris l'analyse et la classification des séquences d'ADN.

Groupement de comportements non supervisés

Explore les techniques de regroupement de comportement et de réduction de dimensionnalité non supervisées, couvrant des algorithmes comme K-Means, DBSCAN et Gaussian Mixture Model.

Visualisation de la science des données avec Pandas

Couvre la manipulation et l'exploration de données à l'aide de Python en mettant l'accent sur les techniques de visualisation.

Régression logistique : Fondements et applications

Explore les fondamentaux de régression logistique, y compris les fonctions de coût, la régularisation et les limites de classification, avec des exemples pratiques utilisant scikit-learn.

Analyse de la composante principale: Eigenfaces

Couvre l'application de l'analyse en composantes principales dans la reconnaissance faciale à l'aide d'un ensemble de données de visages célèbres.

Apprentissage automatique non supervisé: Clustering Basics

Introduit des techniques de clustering d'apprentissage automatique non supervisées telles que K-means, Gaussian Mixture Models et DBSCAN, expliquant leurs algorithmes et leurs applications.

Pipeline de classification : construction et évaluation

Explique la construction et l'évaluation d'un pipeline de classification à l'aide d'ensembles de données de tweet.

Arbres de décision: Classification

Explore les arbres de décision pour la classification, l'entropie, le gain d'information, l'encodage à chaud, l'optimisation de l'hyperparamètre et les forêts aléatoires.

Transition de phase PCA et BBP

Couvre l'application PCA et la transition de phase BBP dans un jeu de données de jeu de cartes.

Méthodes de regroupement

Couvre les méthodes de regroupement des moyennes K, hiérarchiques et DBSCAN avec des exemples pratiques.

Soft K-means Clustering & DBSCAN

Couvre Soft K-means Clustering et DBSCAN principes, algorithmes et comparaison.

Régression : Hautes Dimensions

Explore la régression linéaire en dimensions élevées et la prévision pratique des prix des maisons à partir d'un ensemble de données.

Machine Learning: Techniques d'apprentissage et de clustering non supervisées

Couvre l'apprentissage non supervisé et les méthodes de clustering dans l'apprentissage automatique.

Clustering: Comprendre la similitude intra-classe

Examine les concepts de regroupement, en mettant l'accent sur la similarité intra-classe et les méthodes rentables.

Introduction à l'apprentissage automatique: bases et exemples

Introduit les bases de l'apprentissage automatique, en mettant l'accent sur l'utilisation de Piazza pour les communications liées à la classe et les exercices pratiques en Python.

Optimisations et partitionnement avancés des sparks

Plongez dans les optimisations avancées Spark, le partitionnement, le biais de données, la persistance, MLlib et les meilleures pratiques.

Introduction à la science des données

Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.

Méthodes de clustering : K-means et DBSCAN

Explore les méthodes de clustering K-means et DBSCAN, en discutant des propriétés, des inconvénients, de l'initialisation et de la sélection optimale des clusters.

Arbres de décision et stimulation

Introduit les arbres de décision comme méthode d'apprentissage automatique et explique les techniques de stimulation pour combiner les prédicteurs.