Séance de cours

Data Lakes : structure et optimisation

Séances de cours associées (31)

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Défis de nettoyage des données : Optimisation de la détection des erreurs

S'attaque aux défis du nettoyage des données pour l'analyse, proposant des optimisations pour réduire le temps de traitement.

Fonctions et listes: Compléments et manipulation

Explore les compléments des fonctions, l'ordre des paramètres et la manipulation des listes, y compris le comptage des événements et la résolution du « problème des 100 prisonniers ».

Données, big data, nuages et IoT

Explore la représentation des données, les bases de données, le cloud computing et les défis dans l'environnement cloud.

Entreposage des données : aperçu et défis

Présente les fondamentaux de l'entreposage de données, les défis et le concept novateur de «lakehouse».

Équation de transport: Analyse numérique

Couvre l'optimisation, les problèmes de contrôle et les réseaux neuronaux dans le contexte de l'équation de transport.

Entrepôts de données et systèmes d'aide à la décision

Explore les entrepôts de données, les systèmes d'aide à la décision, OLAP, les lacs de données, les modèles de données multidimensionnels et les optimisations de requêtes.

Représentation des connaissances : sémantique et structures de données

Explore la représentation des connaissances, les structures de données, la sémantique et les défis de la recherche de données sur le Web.

Informatique distribuée : défis et solutions

Explore les défis de l'informatique distribuée, de la croissance des données et des types de données, en mettant l'accent sur la bataille contre les trois V dans le Big Data.

Techniques avancées d'optimisation des sparks : gestion du Big Data

Discute des techniques avancées d'optimisation Spark pour gérer efficacement les Big Data, en se concentrant sur la parallélisation, les opérations de mélange et la gestion de la mémoire.

Mobilités à travers le Big Data

Discute de l'influence de Big Data sur la planification et l'optimisation de la mobilité, explorant ses promesses et ses limites.

Data Wrangling: Processus ETL et questions de querelles

Explore le processus ETL, les étapes de querelles de données et les problèmes courants.

Optimisation avec contraintes : conditions KKT

Couvre les conditions KKT pour l'optimisation avec des contraintes, essentielles pour résoudre efficacement les problèmes d'optimisation.

Entrepôts de données : introduction et défis

Couvre l'introduction et les défis des entrepôts de données, y compris l'intégration des données, la gestion des métadonnées et l'optimisation des performances des requêtes.

Représentation du modèle : Structures et fonctions

Couvre la représentation des modèles mathématiques, des fonctions et des structures de données dans les systèmes d'information.

Analyse du degré de liberté

Explore le degré d'analyse de la liberté, la redondance et la réconciliation des données dans la modélisation et l'optimisation des processus.

Big Data: Traitement et dimensions

Explore la production, le stockage, le traitement et les dimensions de Big Data, ainsi que les défis en matière d'analyse de données, d'élasticité de l'informatique en nuage et de sécurité.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Représentation des données : modèles et systèmes

Discute de la représentation des données au moyen de modèles et de systèmes, couvrant les modèles mathématiques, les structures de données, les niveaux de modélisation et la gestion des données.

Optimisation des systèmes énergétiques

Explore la modélisation, l'optimisation et l'analyse des coûts des systèmes énergétiques pour des opérations efficaces.