Séance de cours

La généralisation dans l'apprentissage profond

Séances de cours associées (32)

Courbes de double descente : surparamétrisation

Explore les courbes de double descente et la surparamétrisation dans les modèles d'apprentissage automatique, en soulignant les risques et les avantages.

S'insère dans le compromis entre la complexité du modèle et le risque, les limites de généralisation, et les dangers d'un ajustement excessif des classes de fonctions complexes.

Bias implicites dans l'apprentissage automatique

Explore les biais implicites, la descente de gradient, la stabilité dans les algorithmes d'optimisation et les limites de généralisation dans l'apprentissage automatique.

Complexité : approximation-estimation

Explore le contrôle de la complexité dans les espaces dhypothèses et le compromis entre lapproximation et lestimation dans la décomposition du risque.

Apprendre avec les réseaux neuronaux profonds

Explore le succès et les défis de l'apprentissage profond, y compris le suréquipement, la généralisation et l'impact sur divers domaines.

Réseaux neuronaux : Réseau neuronal à deux couches

Couvre les bases des réseaux neuraux, en mettant l'accent sur le développement des réseaux neuraux de deux couches vers les réseaux neuraux profonds.

Gradient Descent sur les réseaux neuraux ReLU à deux niveaux

Analyse la descente du gradient sur les réseaux neuraux ReLU à deux couches, en explorant la convergence globale, la régularisation, les biais implicites et l'efficacité statistique.

Compréhension de la généralisation : partialité implicite et optimisation

Explore le compromis entre la complexité et le risque dans les modèles d'apprentissage automatique, les avantages de la surparamétrisation et le biais implicite des algorithmes d'optimisation.

Deep Learning : théorie et pratique

Volkan Cevher se penche sur les mathématiques de l’apprentissage profond, explorant la complexité des modèles, les compromis de risque et le mystère de la généralisation.

Analyse numérique

Couvre des sujets d'analyse numérique avancés, y compris les réseaux neuronaux profonds et les méthodes d'optimisation.

Réseaux neuronaux multicouches: Deep Learning

Couvre les fondamentaux des réseaux neuronaux multicouches et de l'apprentissage profond.

Surajustement: symptômes et caractéristiques

Explore le surajustement dans la régression polynomiale, en soulignant l'importance de la généralisation dans l'apprentissage automatique et les statistiques.

Deep Learning : théorie et applications

Explore les mathématiques de l'apprentissage profond, les réseaux neuronaux et leurs applications dans les tâches de vision par ordinateur, en abordant les défis et le besoin de robustesse.

Techniques de réduction des écarts

Couvre les techniques de réduction de la variance dans l'optimisation, en mettant l'accent sur la descente en gradient et les méthodes de descente en gradient stochastique.

Le paysage d'optimisation de Convex caché des réseaux neuronaux profonds

Explore le paysage d'optimisation convexe caché des réseaux neuronaux profonds, montrant la transition des modèles non convexes aux modèles convexes.

Deep Learning Modus Operandi

Explore les avantages des réseaux plus profonds dans l'apprentissage profond et l'importance de la surparamétrie et de la généralisation.

Deep Learning III

Plongez dans l'optimisation du deep learning, les défis, les variantes SGD, les points critiques, les réseaux surparamétrés et les méthodes adaptatives.

Modèles d'espace d'état : l'expressivité des transformateurs

Couvre les modèles d'espace d'état et l'expressivité des transformateurs dans les tâches de copie de séquence.

Blocs de construction du deep learning : couches linéaires

Explique les blocs de construction fondamentaux de l'apprentissage profond, en se concentrant sur les couches linéaires et les fonctions d'activation.

Théorème d'approximation universelle: MLP

Couvre les perceptrons multicouches (MLP) et leur application de la classification à la régression, y compris le théorème d'approximation universelle et les défis liés aux gradients.