Séance de cours

Questions relatives aux données dans le domaine de la recherche

Séances de cours associées (32)

Représentations et traitement des données dans l'apprentissage automatique

Couvre les représentations de données et les techniques de traitement essentielles pour des algorithmes d'apprentissage automatique efficaces.

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Consommation d'eau à Genève

Explore les données sur la consommation d'eau à Genève, y compris les graphiques sur la consommation et les pertes, les ensembles de données disponibles et les phases de traitement des données.

Génération de langage naturel: Décodage et formation

Explore les défis dans la génération de langage naturel, le décodage des algorithmes, les problèmes de formation et les fonctions de récompense.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Processus de fabrication de pizza

Couvre le processus de fabrication de la pizza, de l'échantillonnage, des moyennes, de la dispersion, des résidus et de la distribution normale.

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.

Analyse des données à l'IA et au ML, Médias sociaux

Explore l'évolution de l'analyse des données à l'IA et au ML, en mettant l'accent sur les mégadonnées, l'apprentissage automatique et l'interaction avec les médias sociaux.

Traitement approximatif des requêtes: BlinkDB

Introduit BlinkDB, un cadre pour le traitement approximatif des requêtes à l'aide de techniques d'échantillonnage.

Études de données critiques : Introduction et modèles

Introduit le cours Études des données critiques, couvrant les modèles de données, la confiance, la reproductibilité, les biais et l'éthique.

Manipulation des données : Intro vers Pandas

Introduit les principes fondamentaux du traitement des données, soulignant l'importance des Pandas et de la modélisation des données pour une analyse efficace.

Big Data: Traitement et dimensions

Explore la production, le stockage, le traitement et les dimensions de Big Data, ainsi que les défis en matière d'analyse de données, d'élasticité de l'informatique en nuage et de sécurité.

Représentations et traitement des données

Explore les représentations de données, le surajustement, la sélection de modèles, le sac de mots et l'apprentissage avec des données déséquilibrées.

Manipulation des données : modèles de données et embrouillement

Examine les éléments fondamentaux de la gestion des données, y compris les modèles, les sources et les querelles, en soulignant l'importance de comprendre et de résoudre les problèmes de données.

Stratégies d'échantillonnage

Explore le processus de recherche, les types variables, la causalité et la corrélation, et les stratégies d'échantillonnage.

Bases de l'apprentissage automatique

Introduit les bases de l'apprentissage automatique, couvrant l'apprentissage supervisé et non supervisé, la régression linéaire et la compréhension des données.

Introduction au traitement des flux de données: concepts et applications

Couvre les principes du traitement des flux de données et de ses applications dans l'analyse de données en temps réel.

Méthodes numériques stochastiques efficaces

Explore des méthodes numériques stochastiques efficaces pour la modélisation et l'apprentissage, couvrant des sujets comme le moteur d'analyse et les inhibiteurs de la kinase.

Génération du langage naturel: Techniques de décodage et défis de formation

Couvre les méthodes de décodage et les défis de formation en génération de langage naturel.

Techniques avancées d'optimisation des sparks : gestion du Big Data

Discute des techniques avancées d'optimisation Spark pour gérer efficacement les Big Data, en se concentrant sur la parallélisation, les opérations de mélange et la gestion de la mémoire.