Séance de cours

Fusion Nexus : Découverte collaborative de données

Séances de cours associées (32)

Entreposage des données : aperçu et défis

Présente les fondamentaux de l'entreposage de données, les défis et le concept novateur de «lakehouse».

Démo virtualisation des données : SmartDataLake

Présente une démo sur la virtualisation adaptative des données dans SmartDataLake, mettant l'accent sur l'assemblage de profils d'entreprise et l'exécution de requêtes de joint à travers les ensembles de données.

Gestion des trajectoires de taxi

Couvre la mise en œuvre d'un système d'information pour la gestion des trajectoires de taxi, y compris le filtrage des données, la création de modèles de trajectoire et la comparaison des performances.

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Analyse des données sur la pollution atmosphérique

Couvre l'analyse des données sur la pollution atmosphérique, en se concentrant sur les bases de R, en visualisant des séries chronologiques et en créant des résumés des concentrations de polluants.

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Analyse des composantes principales : réduction des dimensions

Couvre l'analyse en composantes principales pour la réduction dimensionnelle des données biologiques, en se concentrant sur la visualisation et l'identification des modèles.

L'essentiel de la science des données

Couvre l'essentiel de la science des données, y compris le traitement, la visualisation et l'analyse des données, en mettant l'accent sur les compétences pratiques et l'engagement actif.

Entrepôts de données : introduction et défis

Couvre l'introduction et les défis des entrepôts de données, y compris l'intégration des données, la gestion des métadonnées et l'optimisation des performances des requêtes.

Préparation aux données : améliorer la réponse grâce à la gestion de l’information

Souligne l’importance de la préparation aux données dans les interventions en cas de catastrophe et explore des stratégies pour combler les lacunes et les surcharges en matière d’information.

Analyse du métabolisme urbain

Explore l'évaluation environnementale systémique, l'analyse nationale des flux de matériaux et le développement d'un tableau de bord du métabolisme urbain pour Zurich à l'aide de données ouvertes.

Techniques de gestion des données : HBase et Hive Integration

Couvre les techniques de querelles de données utilisant HBase et Hive, en se concentrant sur l'intégration et les applications pratiques.

Historique numérique et presse numérique

Déplacez-vous dans le « virage numérique » de l'histoire, en examinant la recherche historique à l'aide de journaux numérisés et en explorant la réutilisation du texte, l'intégration des mots et la visualisation des données.

Science collaborative des données : outils et techniques

Introduit des outils collaboratifs de science des données comme Git et Docker, en mettant l'accent sur le travail d'équipe et les exercices pratiques pour un apprentissage efficace.

Écosystèmes Big Data : technologies et défis

Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.

Visualisation des données : Techniques, outils et concepts

Couvre les techniques, les outils et les concepts de visualisation des données pour une représentation efficace des données.

Visualisation des données : Techniques et applications

Explore les techniques de visualisation des données, l'impact de la conception et les applications interactives pour une communication efficace de l'information.

Introduction à la neuroinformatique

Couvre les données neurosciences hétérogènes, les techniques comme les microarrays et le séquençage des gènes, l'intégration des données, et l'importance des métadonnées dans l'organisation et le partage des données.

Supervision : Célébration de l'histoire des thèses doctorales de l'EPFL

Explore l'histoire des thèses doctorales de l'EPFL, la visualisation des données et l'approche innovante D3.