Séance de cours

Le Big Data du passé

Séances de cours associées (32)

Couvre la vue d'ensemble des systèmes d'information, y compris les modèles du monde réel, les types de données et l'évaluation des modèles.

Systèmes d'information distribués : aperçu et modèles

Couvre les systèmes d'information distribués, les tâches clés, les méthodes, les projets, l'évaluation et le soutien aux examens.

Représentation des données : modèles et systèmes

Discute de la représentation des données au moyen de modèles et de systèmes, couvrant les modèles mathématiques, les structures de données, les niveaux de modélisation et la gestion des données.

Systèmes d'information: Aperçu

Couvre la vue d'ensemble des systèmes d'information, la modélisation des données, la gestion des données et la distinction entre les données et l'information.

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.

Sans titre

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Apprentissage automatique: Physique et Données

Déplacez-vous dans l'intersection de la physique et des données dans les modèles d'apprentissage automatique, couvrant des sujets tels que les champs d'expansion des grappes atomiques et l'apprentissage non supervisé.

Introduction aux systèmes de bases de données

Couvre les fondements des systèmes de base de données, y compris la modélisation des données, le traitement de l'information et les défis de la gestion d'importants volumes de données.

Introduction à l'informatique : trois domaines

Couvre l'informatique scientifique, l'automatisation des processus et la gestion des données dans les applications informatiques dans différents secteurs.

Historique numérique et presse numérique

Déplacez-vous dans le « virage numérique » de l'histoire, en examinant la recherche historique à l'aide de journaux numérisés et en explorant la réutilisation du texte, l'intégration des mots et la visualisation des données.

Qu'est-ce qu'un système d'information?

Explore la définition et les composants des systèmes d'information, en mettant l'accent sur leur rôle dans la collecte, le traitement et la distribution de l'information.

Systèmes d'information distribués : aperçu et défis

Couvre les défis des systèmes d'information distribués, y compris l'autonomie, l'hétérogénéité, l'évaluation de la confiance et la protection de la vie privée.

Stratégie de vente au détail axée sur les données

Découvrez la stratégie de détail 7-Eleven Japon axée sur les données pour un avantage concurrentiel et l'excellence opérationnelle, en mettant l'accent sur les systèmes informatiques, la sensibilisation à la marque et la fraîcheur des produits.

Techniques avancées d'optimisation des sparks : gestion du Big Data

Discute des techniques avancées d'optimisation Spark pour gérer efficacement les Big Data, en se concentrant sur la parallélisation, les opérations de mélange et la gestion de la mémoire.

Analyse des données à l'IA et au ML, Médias sociaux

Explore l'évolution de l'analyse des données à l'IA et au ML, en mettant l'accent sur les mégadonnées, l'apprentissage automatique et l'interaction avec les médias sociaux.

Introduction à l'architecture Spark Runtime

Présentation d'Apache Spark, couvrant son architecture, ses RDD, ses transformations, ses actions, sa tolérance aux pannes, ses options de déploiement et ses exercices pratiques dans les blocs-notes Jupyter.

Big Data: Traitement et dimensions

Explore la production, le stockage, le traitement et les dimensions de Big Data, ainsi que les défis en matière d'analyse de données, d'élasticité de l'informatique en nuage et de sécurité.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.