Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.
Explore Junction, une nouvelle approche combinant le contournement du noyau et le multiplexage des ressources pour améliorer les performances du datacenter OS.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Discute de l'histoire et de l'impact des logiciels open source, des données ouvertes et de la science ouverte, en mettant l'accent sur les avantages du partage d'informations à l'ère numérique.
Couvre l'appel du système de fourche dans les systèmes d'exploitation à travers trois exemples pratiques, illustrant la gestion des processus et le flux d'exécution.
Explore l'indexation dans les systèmes de base de données, couvrant le stockage, les fichiers, et des techniques efficaces de récupération de données utilisant différents types d'index.