Séance de cours

Station au sol : traitement des données

Séances de cours associées (32)

Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.

Introduction aux systèmes de bases de données

Couvre les fondements des systèmes de base de données, y compris la modélisation des données, le traitement de l'information et les défis de la gestion d'importants volumes de données.

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Interroger une base de données : le langage SQL

Couvre le langage SQL pour interagir avec les bases de données à travers des requêtes structurées, y compris la sélection, le filtrage, l'agrégation et le tri des données.

Expérience de stage dans l'industrie: Trading Intelligence et analyse de données

Présente l'expérience de stage d'un étudiant en sciences humaines numériques en intelligence commerciale et en analyse de données.

Interconnexions rapides : co-traitement évolutive avec GPU

Explore l'utilisation d'interconnexions rapides pour le co-traitement évolutif avec les GPU dans les bases de données, soulignant l'importance de surmonter le goulot d'étranglement du transfert et de réévaluer les hypothèses d'amélioration des performances.

Manipulation des données : Intro vers Pandas

Introduit les principes fondamentaux du traitement des données, soulignant l'importance des Pandas et de la modélisation des données pour une analyse efficace.

Modélisation des données : concepts et applications

Introduit des concepts de modélisation de données, l'utilisation de SQL et des applications de bibliothèque Pandas pour un traitement efficace des données.

Cadres de données Spark

Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.

Traitement des données à l'échelle massive: Techniques d'optimisation des requêtes

Discute des techniques d'optimisation des requêtes pour le traitement des données à grande échelle, en comparant les stratégies d'optimisation et les possibilités de partage pour réduire les coûts de traitement.

Entrepôts de données : introduction et défis

Couvre l'introduction et les défis des entrepôts de données, y compris l'intégration des données, la gestion des métadonnées et l'optimisation des performances des requêtes.

Bases de données NoSQL : vue d'ensemble

Explore le monde des bases de données NoSQL et les principales fonctionnalités de MongoDB.

Opérateurs de requêtes: Partie 1

Explore les étapes de traitement des requêtes, les plans physiques, l'exécution en pipeline et le hachage pour les projections et les jointures.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Optimisation des requêtes relationnelles

Couvre l'optimisation des requêtes relationnelles, y compris les plans de requêtes logiques et physiques, l'estimation des coûts, les équivalences et la stratégie du système R.

Techniques de gestion des données : HBase et Hive Integration

Couvre les techniques de querelles de données utilisant HBase et Hive, en se concentrant sur l'intégration et les applications pratiques.

Traitement des demandes de renseignements avec les opérations relationnelles

Couvre le traitement des requêtes avec des opérations relationnelles, y compris l'optimisation des requêtes et différents algorithmes de jonction.

Représentation - Acquisition - Gestion

Couvre la représentation, l'acquisition et la gestion des données géospatiales.

Questions relatives aux données dans le domaine de la recherche

Examine les défis que posent les hypothèses de données, les biais et d'autres aspects de la recherche, y compris les écritures incomplètes et les frustrations des nouveaux arrivants.

Traduction de pour

Explique la traduction de for-expressions en Scala à l'aide de fonctions map, flatmap et filter, avec des exemples et une discussion sur sa généralisation à différents types.