Concept

Vanishing gradient problem

Séances de cours associées (31)

Introduit des réseaux de flux, couvrant la structure du réseau neuronal, la formation, les fonctions d'activation et l'optimisation, avec des applications en prévision et finance.

Perceptron multicouche : formation et optimisation

Explore le modèle de perceptron multicouche, la formation, l'optimisation, le prétraitement des données, les fonctions d'activation, la rétropropagation et la régularisation.

Réseaux neuronaux récurrents : modèles de langage neuronal

Explore les modèles de langage neuronal à context fixe, les RNN, les gradients de disparition et l'étiquetage séquentiel dans NLP.

Modélisation linguistique et réseaux neuronaux récurrents

Explore la modélisation linguistique, les RNN, les modèles n-gram, les LSTM et les RNN bidirectionnelles.

Deep Learning: Propagation vers l'arrière et Gradient de disparition

Plonge dans la propagation en arrière dans l'apprentissage profond, répondant au défi de la disparition du gradient et à la nécessité d'unités cachées efficaces.

Réseaux de mémoire à court terme

Introduit les réseaux de mémoire à long terme (LSTM) comme une solution pour la disparition et l'explosion des gradients dans les réseaux neuronaux récurrents.

Réseaux neuronaux récurrents: LSTM et GRU

Explore les variantes LSTM et GRU dans les réseaux neuronaux récurrents, en abordant les défis et les avantages.

Réseaux de neurones récurrents: formation et défis

Discute des réseaux neuronaux récurrents, de leurs défis de formation et de solutions telles que les LSTM et les GRU.

Problème de gradient de disparition: Deep Learning

Discute du problème du gradient de fuite dans les réseaux neuronaux profonds et de ses solutions.

Normalisation par lots: pourquoi cela fonctionne

Explore le but et le processus de normalisation par lots dans les réseaux neuronaux profonds, en soulignant son importance dans la stabilisation de l'entrée moyenne et la résolution du problème du gradient de fuite.

Traduction automatique : Mécanisme d'attention

Explore le mécanisme d'attention dans la traduction automatique, en s'attaquant au problème du goulot d'étranglement et en améliorant considérablement les performances NMT.

Deep Learning

Couvre les bases de l'apprentissage profond, y compris les représentations de données, le sac de mots, le prétraitement des données, les réseaux de neurones artificiels et les réseaux de neurones convolutifs.

Deep Learning pour le NLP

Explore l'apprentissage profond pour la PNL, en couvrant les insertions de mots, les représentations contextuelles, les techniques d'apprentissage et les défis tels que les gradients de disparition et les considérations éthiques.

Réseaux neuronaux : formation et optimisation

Explore la formation, l'optimisation et les considérations environnementales des réseaux neuronaux, avec des informations sur les clusters PCA et K-means.

Séquence à modèles de séquence: vue d'ensemble et applications

Couvre les modèles de séquence à séquence, leur architecture, leurs applications et le rôle des mécanismes d'attention dans l'amélioration des performances.

Les principes fondamentaux de l'apprentissage profond

Introduit un apprentissage profond, de la régression logistique aux réseaux neuraux, soulignant la nécessité de traiter des données non linéairement séparables.

Deep Learning : Perceptron multicouche et formation

Couvre les fondamentaux de l'apprentissage profond, en se concentrant sur les perceptrons multicouches et leurs processus de formation.

Modèles stochastiques pour les communications

Couvre les modèles stochastiques pour les systèmes de communication et leur impact sur les performances du système.

NFNets: Suppression du batchNorm pour la reconnaissance de l'image à haut rendement

Explore NFNets comme une alternative au BatchNorm dans ResNets, en obtenant des performances élevées sur ImageNet.

Mise à jour de poids: entrée moyenne et problème de biais

Discute du décalage d'entrée moyen et du problème de biais dans les mises à jour de poids pour les réseaux neuronaux, soulignant l'importance d'une initialisation correcte pour prévenir les problèmes de gradient.