Séance de cours

Défis de stockage distribué

Séances de cours associées (31)

Couvre la configuration d'un agent Gitlab pour Kubernetes, en mettant l'accent sur l'installation, le contrôle de version et le dépannage.

Abstraction du système de fichiers: Comprendre les fichiers et les répertoires

Explique l'abstraction du système de fichiers, en se concentrant sur les fichiers, les répertoires et leur gestion au sein d'un système informatique.

Visite des services d'hébergement Web Legacy

Couvre une visite des anciens services d'hébergement Web et des discussions sur le stockage futur des services.

Sans titre

Traitement de l'image aux Fidji

Couvre les bases du traitement d'image à l'aide du logiciel fidjien, en se concentrant sur la gestion des fichiers et l'application de filtres.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Systèmes de fichiers

Couvre les fondamentaux des systèmes de fichiers, se concentrant sur la gestion efficace des blocs persistants et la mise en œuvre des API système de fichiers.

L'échange de données avec Hadoop

Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.

Introduction à la science des données

Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.

Sans titre

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Gestion de fichiers et gestion des exceptions en Python

Se concentre sur la gestion de fichiers et la gestion des exceptions dans la programmation Python.

Contrôle d'accès discrétionnaire : Linux et Windows

Explore le contrôle d'accès sous Linux et Windows, couvrant les identités des utilisateurs Unix, les listes de contrôle d'accès aux fichiers, les utilisateurs spéciaux, les super utilisateurs et les listes de contrôle d'accès discrétionnaires de Windows.

Traitement statistique du signal

Couvre les modèles de mélange gaussien, le denoising, la classification des données et le tri à laide de lanalyse en composantes principales.

Programmation Matlab: Script et Fonction

Explore la programmation Matlab avec des scripts et des fonctions, vectorisation et graphiques 2D.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Matlab: 3D Surface Plotting

Couvre les tableaux logiques, les tracés de surface 3D, les courbes paramétriques, l'interpolation et l'ajustement dans Matlab.

Indexation dans les systèmes de bases de données

Explore l'indexation dans les systèmes de base de données, couvrant le stockage, les fichiers, et des techniques efficaces de récupération de données utilisant différents types d'index.

Aperçu de la formation d'Alfresco

Couvre la mise en place de réunions Zoom, la gestion d'instances sur AWS, la création de billets de blog, la gestion d'utilisateurs et de groupes, et l'utilisation de fonctions de recherche avancée.

Sans titre