Séance de cours

Introduction à l'architecture Spark Runtime

Séances de cours associées (32)

Analyse des données: Concentrations de KMnO4

Couvre l'analyse des concentrations de KMnO4 à l'aide de données provenant d'un fichier CSV.

Techniques avancées d'optimisation des sparks : gestion du Big Data

Discute des techniques avancées d'optimisation Spark pour gérer efficacement les Big Data, en se concentrant sur la parallélisation, les opérations de mélange et la gestion de la mémoire.

Stockage et transmission des données 1: introduction; besoin de structure

Discute de l'importance de structurer les données pour un stockage et une recherche efficaces.

Règlements : chiffres des règlements

Couvre l'analyse des données de fréquence cardiaque ECG et des mesures de débit respiratoire à l'aide d'Excel.

Biomécanique : Analyse de la vélocité

Explore l'analyse des données de vélocité en biomécanique à l'aide d'Excel pour la visualisation et l'interprétation.

Science collaborative des données : outils et techniques

Introduit des outils collaboratifs de science des données comme Git et Docker, en mettant l'accent sur le travail d'équipe et les exercices pratiques pour un apprentissage efficace.

L'échange de données avec Hadoop

Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.

Analyse des composantes principales : réduction des dimensions

Couvre l'analyse en composantes principales pour la réduction dimensionnelle des données biologiques, en se concentrant sur la visualisation et l'identification des modèles.

Analyse du métabolisme urbain

Explore l'évaluation environnementale systémique, l'analyse nationale des flux de matériaux et le développement d'un tableau de bord du métabolisme urbain pour Zurich à l'aide de données ouvertes.

Introduction aux systèmes de bases de données

Couvre les fondements des systèmes de base de données, y compris la modélisation des données, le traitement de l'information et les défis de la gestion d'importants volumes de données.

Visualisation de la science des données avec Pandas

Couvre la manipulation et l'exploration de données à l'aide de Python en mettant l'accent sur les techniques de visualisation.

Analyse des données sur la pollution atmosphérique

Couvre l'analyse des données sur la pollution atmosphérique, en se concentrant sur les bases de R, en visualisant des séries chronologiques et en créant des résumés des concentrations de polluants.