Introduit la modélisation sémantique par le biais de données tabulaires et de RDF, couvrant les bases de données relationnelles, la migration de schémas, les schémas à l'épreuve du temps, l'interrogation SPARQL et les limitations de métaconnaissance.
Introduit des concepts de modélisation de données, l'utilisation de SQL et des applications de bibliothèque Pandas pour un traitement efficace des données.
Couvre le langage SQL pour interagir avec les bases de données à travers des requêtes structurées, y compris la sélection, le filtrage, l'agrégation et le tri des données.
Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.