Couvre les fondamentaux des systèmes de fichiers, se concentrant sur la gestion efficace des blocs persistants et la mise en œuvre des API système de fichiers.
Discute de la gestion des périphériques dans les systèmes d'exploitation, en se concentrant sur les pilotes de périphériques, la persistance et les techniques d'optimisation des performances.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Couvre les bases des opérations d'entrée/sortie en C++, y compris l'interaction avec le monde par des entrées clavier/écran, des opérations de fichiers et le formatage des données d'entrée/sortie.
Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.
Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.
Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.
Explore les données sur la consommation d'eau à Genève, y compris les graphiques sur la consommation et les pertes, les ensembles de données disponibles et les phases de traitement des données.
Couvre les méthodes de recherche de ligne de gradient et les techniques d'optimisation en mettant l'accent sur les conditions Wolfe et la définition positive.
Explore l'organisation des fichiers, les techniques d'indexation et les métadonnées dans les bases de données, soulignant l'importance de choisir la bonne clé de recherche.
Explore l'API du système de fichiers, les inodes, les descripteurs de fichiers, les tendances de stockage, les opérations de fichiers souhaitées, et les couches de logiciels de FS.