Séance de cours

Formats de données rapides

Séances de cours associées (32)

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Data Wrangling avec Hadoop : formats de stockage et ruche

Explore les querelles de données avec Hadoop, en mettant l'accent sur les formats de stockage et Hive pour le traitement des données volumineuses.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Techniques avancées d'optimisation des sparks : gestion du Big Data

Discute des techniques avancées d'optimisation Spark pour gérer efficacement les Big Data, en se concentrant sur la parallélisation, les opérations de mélange et la gestion de la mémoire.

Écosystèmes Big Data : technologies et défis

Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.

Révolutionnaire Flynova

Présente la nouvelle Flynova, remettant en question l'idée que les modèles emblématiques sont dépassés.

Menace de stéréotype : effets et atténuation

S'interroge sur la façon dont les stéréotypes négatifs peuvent influer sur le rendement et sur les stratégies proposées pour atténuer ces effets.

Comprendre la menace du stéréotype

S'insère dans la menace stéréotypée et son impact sur la performance en raison de la crainte de confirmer les stéréotypes.

Consommation d'eau à Genève

Explore les données sur la consommation d'eau à Genève, y compris les graphiques sur la consommation et les pertes, les ensembles de données disponibles et les phases de traitement des données.

Traitement des données

Couvre le traitement des données d'une expérience chimique à l'aide d'Excel.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Analyse et prévision des données Excel

Couvre les bases de l'analyse des données Excel et des techniques de prévision.

L'échange de données avec Hadoop

Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.

Opérateurs de requête : jointures et techniques de traitement des requêtes

Discute des opérateurs de requête avancés, en se concentrant sur les techniques de jointure et leurs méthodes de traitement dans les bases de données relationnelles.

Accélérer l’analyse des données : les innovations de l’ère post-Moore

Couvre les progrès des systèmes d'analyse de données et le rôle de la co-conception matériel-logiciel dans l'amélioration des performances à l'ère post-Moore.

Réservoirs et barrages : construction et dimensionnement hydrauliques

Explore le dimensionnement des réservoirs et des barrages en utilisant des courbes d'écoulement cumulatives et le dimensionnement des réservoirs pour les périodes sèches et pluvieuses.

Hashing et tri

Couvre le hachage, le tri, le hachage extensible, le hachage linéaire et le tri externe.

Gestion du stockage dans SmartDataLake

Explore les défis de gestion du stockage dans la transition vers les lacs de données, en abordant l'hétérogénéité des logiciels et du matériel, la conception unifiée du stockage et l'optimisation des performances.

Introduction à la science des données

Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.

Correction de l'informatique sans serveur avec le matériel Open-Source

Explore les défis et les solutions dans l'informatique sans serveur, en mettant l'accent sur l'utilisation de l'énergie, l'utilisation du cloud, l'architecture FaaS et l'analyse des performances.