Entrepôts de données : introduction et défis

À propos
Confidentialité
Mentions légales

Graph Chatbot

Séances de cours associées (32)

Consommation d'eau à Genève

Explore les données sur la consommation d'eau à Genève, y compris les graphiques sur la consommation et les pertes, les ensembles de données disponibles et les phases de traitement des données.

Introduction à l'architecture Spark Runtime

Couvre l'architecture d'exécution Spark, y compris les RDD, les transformations, les actions et la mise en cache pour l'optimisation des performances.

Intelligence en temps réel : défis liés aux données et évolution du matériel

Explore les défis de données et l'évolution matérielle pour l'intelligence en temps réel à l'ère du big data.

Formats de données et brouillage de données avec Hadoop

Explore Apache Hive pour l'entreposage de données, les formats de données et la partition, avec des exercices pratiques dans la requête et la connexion à Hive.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Introduction au traitement des flux de données: concepts et applications

Couvre les principes du traitement des flux de données et de ses applications dans l'analyse de données en temps réel.

Représentation des connaissances : sémantique et structures de données

Explore la représentation des connaissances, les structures de données, la sémantique et les défis de la recherche de données sur le Web.

Informatique distribuée : défis et solutions

Explore les défis de l'informatique distribuée, de la croissance des données et des types de données, en mettant l'accent sur la bataille contre les trois V dans le Big Data.

Nexus Forge : créer et utiliser facilement des graphiques de connaissances

Explore Nexus Forge, un outil pour créer et utiliser des graphiques de connaissances sans effort.

Techniques avancées d'optimisation des sparks : gestion du Big Data

Discute des techniques avancées d'optimisation Spark pour gérer efficacement les Big Data, en se concentrant sur la parallélisation, les opérations de mélange et la gestion de la mémoire.

Fusion Nexus : Découverte collaborative de données

Couvre Nexus Fusion, une plateforme pour la découverte collaborative de données et de connaissances, y compris la gestion des données, la présentation et la recherche.

Introduction à l'architecture Spark Runtime

Présentation d'Apache Spark, couvrant son architecture, ses RDD, ses transformations, ses actions, sa tolérance aux pannes, ses options de déploiement et ses exercices pratiques dans les blocs-notes Jupyter.

Page 2 sur 2