Séance de cours

Construisez votre base de données : Structure et gestion des données

Séances de cours associées (32)

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Modélisation des données : concepts et applications

Introduit des concepts de modélisation de données, l'utilisation de SQL et des applications de bibliothèque Pandas pour un traitement efficace des données.

Représentation du modèle : Structures et fonctions

Couvre la représentation des modèles mathématiques, des fonctions et des structures de données dans les systèmes d'information.

Science des données pour les ingénieurs: Partie 2

Explore la manipulation, l'exploration et la visualisation de données dans des projets de science des données en utilisant Python.

DDL, DML, Vues

Couvre la définition des données SQL, la manipulation et les vues dans les bases de données.

Données, big data, nuages et IoT

Explore la représentation des données, les bases de données, le cloud computing et les défis dans l'environnement cloud.

Gestion des données : Aperçu

Présente les concepts fondamentaux de la gestion des données, y compris les modèles de données, les bases de données et les tâches clés.

Fonctions avancées des pandas

Se concentre sur les fonctions avancées de pandas pour la manipulation, l'exploration et la visualisation des données avec Python, en soulignant l'importance de la compréhension et de la préparation des données.

Analyse des données sur la pollution atmosphérique

Couvre l'analyse des données sur la pollution atmosphérique, en se concentrant sur les bases de R, en visualisant des séries chronologiques et en créant des résumés des concentrations de polluants.

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.

Manipulation des données : Intro vers Pandas

Introduit les principes fondamentaux du traitement des données, soulignant l'importance des Pandas et de la modélisation des données pour une analyse efficace.

Science des données avec Python

Couvre les bases de Python, Pandas, la manipulation de données, la visualisation et l'apprentissage automatique.

L'essentiel de la science des données: Pandas, Numpy, Matplotlib

Présente Pandas, Numpy et Matplotlib pour l'analyse et la visualisation des données dans Python.

Structuration de l'analyse exploratoire des données spatiales

Explore l'approche structurée de l'analyse exploratoire des données spatiales, en soulignant l'importance des cadres analytiques et du mantra de recherche visuelle.

Supervision : Célébration de l'histoire des thèses doctorales de l'EPFL

Explore l'histoire des thèses doctorales de l'EPFL, la visualisation des données et l'approche innovante D3.

Analyse du métabolisme urbain

Explore l'évaluation environnementale systémique, l'analyse nationale des flux de matériaux et le développement d'un tableau de bord du métabolisme urbain pour Zurich à l'aide de données ouvertes.

L'essentiel de la science des données

Couvre l'essentiel de la science des données, y compris le traitement, la visualisation et l'analyse des données, en mettant l'accent sur les compétences pratiques et l'engagement actif.

Introduction aux systèmes de bases de données

Couvre les fondements des systèmes de base de données, y compris la modélisation des données, le traitement de l'information et les défis de la gestion d'importants volumes de données.

Introduction à NumPy et Matplotlib pour l'informatique scientifique

Présentation de NumPy et Matplotlib, outils essentiels pour le calcul scientifique et la visualisation de données en Python.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.