Concept

Algorithme du gradient stochastique

Séances de cours associées (28)

Méthodes de graduation adaptative: Partie 1

Explore les méthodes de gradient adaptatif et leur impact sur les scénarios d'optimisation, y compris AdaGrad, ADAM et RMSprop.

Optimisation : descente de gradient et sous-gradients

Explore des méthodes d'optimisation telles que la descente de gradient et les sous-gradients pour la formation de modèles d'apprentissage automatique, y compris des techniques avancées telles que l'optimisation d'Adam.

Optimisation stochastique : Algorithmes et méthodes

Explore les algorithmes d'optimisation stochastique et les méthodes pour les problèmes convexes avec des risques lisses et non lisses.

Descente de gradient stochastique: techniques d'optimisation non convexes

Discute de la descente de gradient stochastique et de son application dans l'optimisation non convexe, en se concentrant sur les taux de convergence et les défis de l'apprentissage automatique.

Réseaux neuronaux : formation et optimisation

Explore la formation, l'optimisation et les considérations environnementales des réseaux neuronaux, avec des informations sur les clusters PCA et K-means.

Techniques d'optimisation: Descente de gradient stochastique et au-delà

Discute des techniques d'optimisation dans l'apprentissage automatique, en se concentrant sur la descente de gradient stochastique et ses applications dans les problèmes contraints et non convexes.

Optimisation dans l'apprentissage automatique: Gradient Descent

Couvre l'optimisation dans l'apprentissage automatique, en mettant l'accent sur la descente par gradient pour la régression linéaire et logistique, la descente par gradient stochastique et des considérations pratiques.

Réseaux neuronaux : formation et optimisation

Explore la formation et l'optimisation des réseaux neuronaux, en abordant des défis tels que les fonctions de perte non convexes et les minima locaux.

Descente Coordonnée : Stratégies d’optimisation

Explore coordonner les stratégies d'optimisation de descente, en mettant l'accent sur la simplicité dans l'optimisation grâce à des mises à jour coordonnées et en discutant des implications des différentes approches.

Optimisation des taux de convergence : Descente de gradient accélérée/stochastique

Couvre l'optimalité des taux de convergence dans les méthodes de descente en gradient accéléré et stochastique pour les problèmes d'optimisation non convexes.

Gradient Descent: Techniques d'optimisation

Explore la descente en gradient, les fonctions de perte et les techniques d'optimisation dans la formation en réseau neuronal.

Perceptron multicouche : formation et optimisation

Explore le modèle de perceptron multicouche, la formation, l'optimisation, le prétraitement des données, les fonctions d'activation, la rétropropagation et la régularisation.

Gradient Descent: Régression linéaire

Couvre le concept de descente de gradient pour la régression linéaire, en expliquant le processus itératif de mise à jour des paramètres.

Méthodes d'optimisation adaptative: théorie et applications

Explore des méthodes d'optimisation adaptative qui s'adaptent localement et convergent sans connaître la constante de douceur.

Structures dans l'optimisation non convexe

Explore l'optimisation non convexe dans l'apprentissage profond, couvrant les points critiques, la convergence SGD, les points de selle et les méthodes de gradient adaptatif.

Deep Learning : représentation de données et perception multicouche

Couvre la représentation des données, la formation MLP, les fonctions d'activation et l'apprentissage basé sur le gradient dans les réseaux de neurones profonds.

Méthodes d'optimisation : RMSprop et ADAM

Explore les méthodes d'optimisation RMSprop et ADAM dans les réseaux neuronaux artificiels, en se concentrant sur les fonctions d'erreur, l'élan et le rapport signal/bruit.

Introduction à l'apprentissage par la descente en gradient stochastique: Perceptron simple

Couvre la dérivation de la formule de descente de gradient stochastique pour un perceptron simple et explore l'interprétation géométrique de la classification.

Bruit de graduation : Risques lisses et non lisses

Explore l'impact du bruit de gradient sur les algorithmes d'optimisation, en se concentrant sur les fonctions de risque lisses et non lisses et la dérivation des moments de bruit de gradient.

Réseaux neuronaux convolutionnels

Couvre les réseaux neuronaux convolutionnels, y compris les couches, les stratégies de formation, les architectures standard, les tâches comme la segmentation sémantique, et les astuces d'apprentissage profond.