Séance de cours

Entreposage de tableaux dans les lacs de données

Séances de cours associées (32)

Couvre la configuration d'un agent Gitlab pour Kubernetes, en mettant l'accent sur l'installation, le contrôle de version et le dépannage.

Visite des services d'hébergement Web Legacy

Couvre une visite des anciens services d'hébergement Web et des discussions sur le stockage futur des services.

Dans Silico Neuroscience: Reproductibilité et réutilisabilité des données

Souligne la reproductibilité et la réutilisabilité des données dans les neurosciences silico, en mettant l'accent sur les outils et les méthodes de neuroinformatique.

Organisation du fichier : Gestion du stockage et du cache

Explore l'organisation des fichiers et des pages dans les bases de données, la gestion des caches et les fichiers log-structurés.

Indexation : Organisation des fichiers et techniques

Explore l'organisation des fichiers, les techniques d'indexation et les métadonnées dans les bases de données, soulignant l'importance de choisir la bonne clé de recherche.

Stockage et transmission des données: Métadonnées pour les disques

Explore l'importance des métadonnées dans l'organisation des bibliothèques médiatiques et les défis que pose la récupération efficace d'oeuvres ou d'artistes spécifiques.

Données, big data, nuages et IoT

Explore la représentation des données, les bases de données, le cloud computing et les défis dans l'environnement cloud.

Analyse des données sur les neurosciences

Explore l'analyse des données neurosciences, en se concentrant sur les courants K+ et Na+, les courants Ca2+ et la reproductibilité des données.

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Stockage et transmission des données : accès à l'information

Couvre l'importance des métadonnées pour accéder à l'information et structurer les données pour le stockage et la transmission.

Systèmes de fichiers

Couvre les fondamentaux des systèmes de fichiers, se concentrant sur la gestion efficace des blocs persistants et la mise en œuvre des API système de fichiers.

Protocoles de recherche et de routage

Explore les protocoles de recherche et de routage non structurés et structurés, en soulignant l'importance des hypothèses de structure du réseau et en introduisant l'algorithme 'Bubble Storm'.

Implémentation du système de fichiers : gestion des données sur les disques

Explique la mise en œuvre des systèmes de fichiers et comment les données sont gérées sur les supports de stockage persistants.

Systèmes de fichiers: Techniques d'organisation et d'indexation

Discute des systèmes de fichiers, en mettant l'accent sur l'organisation des données, les techniques d'indexation et leur impact sur les performances de la base de données.

Métadonnées: Principes et normes généraux

Couvre l'importance des métadonnées dans les systèmes d'information géographique, en mettant l'accent sur les normes et les principes.

Virtualisation des données : SmartDataLake

Explore la virtualisation des données dans le projet SmartDataLake, couvrant l'optimisation des requêtes, le niveau de stockage et les défis dans le traitement de données hétérogènes.

Architecture de CockroachDB

Explore l'architecture de CockroachDB, en se concentrant sur la gestion des transactions, le contrôle de la concurrence et l'évolutivité.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Introduction aux systèmes de bases de données

Couvre les bases des systèmes de base de données, y compris la modélisation des données, le SGBD, l'indépendance des données et l'aperçu du cours.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.