Séance de cours

Fonctions avancées des pandas

Séances de cours associées (32)

Visualisation de la science des données avec Pandas

Couvre la manipulation et l'exploration de données à l'aide de Python en mettant l'accent sur les techniques de visualisation.

Introduction à la science des données

Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.

Fonctions avancées des pandas

Se concentre sur les fonctions avancées de pandas pour la manipulation, l'exploration et la visualisation des données avec Python, en soulignant l'importance de la compréhension et de la préparation des données.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Science des données pour les ingénieurs: Partie 2

Explore la manipulation, l'exploration et la visualisation de données dans des projets de science des données en utilisant Python.

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Écosystèmes Big Data : technologies et défis

Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.

Compréhension des courbes ROC

Explore la courbe ROC, le taux vrai positif, le taux faux positif et les probabilités de prédiction dans les modèles de classification.

Introduction générale à la science des données

Offre une introduction complète à la science des données, couvrant Python, Numpy, Pandas, Matplotlib et Scikit-learn, en mettant l'accent sur les exercices pratiques et le travail collaboratif.

Data Wrangling avec Hadoop : formats de stockage et ruche

Explore les querelles de données avec Hadoop, en mettant l'accent sur les formats de stockage et Hive pour le traitement des données volumineuses.

Introduction à l'architecture Spark Runtime

Présentation d'Apache Spark, couvrant son architecture, ses RDD, ses transformations, ses actions, sa tolérance aux pannes, ses options de déploiement et ses exercices pratiques dans les blocs-notes Jupyter.

Mise à jour Excel: Fonctions avancées et analyse de données

Couvre les fonctions avancées Excel et les techniques d'analyse de données, y compris l'enregistrement automatique et l'utilisation de Solver.

Introduction à Renku

Introduit Renku, une plateforme pour la science collaborative des données, mettant l'accent sur la reproductibilité, la shareability, la réutilisabilité et la sécurité.

Techniques d'analyse de données: Amplitude Shift Keying et méthodes graphiques

Couvre la saisie par décalage d'amplitude et diverses techniques d'analyse de données à l'aide de Jupyter Notebooks.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Scopes and Lambdas: Data Science avec Python

Couvre les champs d'application, les lambdas et les pandas en science des données avec Python, y compris les déclarations imbriquées, la détermination de la portée, les affectations et la manipulation des pandas.

Analyse des erreurs et Interpolation

Explore l'analyse des erreurs et les limites de l'interpolation sur des nœuds uniformément répartis.

Réservoirs et barrages : construction et dimensionnement hydrauliques

Explore le dimensionnement des réservoirs et des barrages en utilisant des courbes d'écoulement cumulatives et le dimensionnement des réservoirs pour les périodes sèches et pluvieuses.

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.

L'essentiel de la science des données

Couvre l'essentiel de la science des données, y compris le traitement, la visualisation et l'analyse des données, en mettant l'accent sur les compétences pratiques et l'engagement actif.