Séance de cours

Compréhension des courbes ROC

Séances de cours associées (30)

Data Wrangling avec Hadoop : formats de stockage et ruche

Explore les querelles de données avec Hadoop, en mettant l'accent sur les formats de stockage et Hive pour le traitement des données volumineuses.

Science collaborative des données : outils et techniques

Introduit des outils collaboratifs de science des données comme Git et Docker, en mettant l'accent sur le travail d'équipe et les exercices pratiques pour un apprentissage efficace.

Le saut quantique : théorie et algorithmes

Explore la théorie des sauts quantiques dans les systèmes quantiques ouverts et leur simulation.

L'échange de données avec Hadoop

Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.

Programmation R : conditions, boucles, fonctions et graphiques

Couvre les conditions, les boucles, les fonctions et les graphiques en programmation R avec des exemples pratiques.

Répercussions du mois de naissance sur le succès des athlètes

Enquêter sur la façon dont le mois de naissance influence le succès des athlètes, analyser l'ensemble de données des athlètes japonais pour explorer les tendances dans les dates de naissance et les professions.

Arbres de décision: Classification

Explore les arbres de décision pour la classification, l'entropie, le gain d'information, l'encodage à chaud, l'optimisation de l'hyperparamètre et les forêts aléatoires.

Preuve de fraude dans l'analyse des données

Explore les anomalies dans l'analyse des données, révélant des fraudes potentielles grâce à des modèles et des incohérences suspects.

Écosystèmes Big Data : technologies et défis

Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.