Séance de cours

Sans titre

Séances de cours associées (32)

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Gestion du stockage dans SmartDataLake

Explore les défis de gestion du stockage dans la transition vers les lacs de données, en abordant l'hétérogénéité des logiciels et du matériel, la conception unifiée du stockage et l'optimisation des performances.

Stockage et transmission des données 1: introduction; besoin de structure

Discute de l'importance de structurer les données pour un stockage et une recherche efficaces.

Contrôle comportemental chez les animaux et les robots

Explore le contrôle du comportement chez les animaux et les robots, couvrant les perspectives historiques, l'activation des neurones, le modèle de Drosophila, les techniques avancées et l'organisation de mini-projets.

Dans Silico Neuroscience: Reproductibilité et réutilisabilité des données

Souligne la reproductibilité et la réutilisabilité des données dans les neurosciences silico, en mettant l'accent sur les outils et les méthodes de neuroinformatique.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Défis en matière de sécurité informatique

Explore les défis de sécurité informatique, les systèmes de stockage d'objets, la transition de gestion du site, le déploiement de la sécurité du réseau et la gestion de portefeuilles de projets à l'EPFL.

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.

Probabilité maximale: Inférence et comparaison du modèle

Explore l'inférence de vraisemblance maximale, la sélection de modèles et la comparaison de modèles à l'aide de ratios de vraisemblance.

Écosystèmes Big Data : technologies et défis

Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.

Apprentissage automatique: Physique et Données

Déplacez-vous dans l'intersection de la physique et des données dans les modèles d'apprentissage automatique, couvrant des sujets tels que les champs d'expansion des grappes atomiques et l'apprentissage non supervisé.

Sans titre

Données, big data, nuages et IoT

Explore la représentation des données, les bases de données, le cloud computing et les défis dans l'environnement cloud.

Analyse des données à l'IA et au ML, Médias sociaux

Explore l'évolution de l'analyse des données à l'IA et au ML, en mettant l'accent sur les mégadonnées, l'apprentissage automatique et l'interaction avec les médias sociaux.

Introduction à la programmation R pour la génétique et la génomique

Introduit un cours sur la génétique et la génomique, en se concentrant sur la programmation R avec des exercices interactifs.

L'essentiel de la science des données

Couvre l'essentiel de la science des données, y compris le traitement, la visualisation et l'analyse des données, en mettant l'accent sur les compétences pratiques et l'engagement actif.

L'échange de données avec Hadoop

Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.

Factorisation Hadamard

Couvre le théorème de factorisation de Hadamard pour des fonctions entières d'ordre au plus 1.

Mémoire cache

Explore la conception de mémoire cache, les succès, les ratés et les politiques d'expulsion dans les systèmes informatiques, en mettant l'accent sur la localité spatiale et temporelle.