Concept

Long short-term memory

Séances de cours associées (32)

Modélisation linguistique et réseaux neuronaux récurrents

Explore la modélisation linguistique, les RNN, les modèles n-gram, les LSTM et les RNN bidirectionnelles.

Introduit les réseaux de mémoire à long terme (LSTM) comme une solution pour la disparition et l'explosion des gradients dans les réseaux neuronaux récurrents.

Réseaux neuronaux récurrents: LSTM et GRU

Explore les variantes LSTM et GRU dans les réseaux neuronaux récurrents, en abordant les défis et les avantages.

Réseaux de neurones récurrents: formation et défis

Discute des réseaux neuronaux récurrents, de leurs défis de formation et de solutions telles que les LSTM et les GRU.

Deep Learning: Réseaux neuronaux récurrents

Explore les réseaux neuronaux récurrents pour les données comportementales, couvrant le repérage de connaissances profondes, les réseaux LSTM, GRU, le réglage hyperparamétrique et les tâches de prévision de séries chronologiques.

Seq2Seq Modèles: Attention vs. Pas d'attention

Explore les modèles Seq2Seq avec et sans mécanismes d'attention, couvrant l'architecture encodeur-décodeur, les vecteurs de contexte, les processus de décodage et les différents types de mécanismes d'attention.

Séquence à modèles de séquence: vue d'ensemble et applications

Couvre les modèles de séquence à séquence, leur architecture, leurs applications et le rôle des mécanismes d'attention dans l'amélioration des performances.

Réseaux neuronaux récurrents : modèles de langage neuronal

Explore les modèles de langage neuronal à context fixe, les RNN, les gradients de disparition et l'étiquetage séquentiel dans NLP.

Estimation de la pose de la balle et de la poche

Se concentre sur l'estimation de la pose articulaire de la balle et de la poche à l'aide d'un champ magnétique dans une conception anthropomorphe avec muscles artificiels et tendons.

Traduction automatique : Mécanisme d'attention

Explore le mécanisme d'attention dans la traduction automatique, en s'attaquant au problème du goulot d'étranglement et en améliorant considérablement les performances NMT.

Deep Learning pour le NLP

Explore l'apprentissage profond pour la PNL, en couvrant les insertions de mots, les représentations contextuelles, les techniques d'apprentissage et les défis tels que les gradients de disparition et les considérations éthiques.

Représentations contextuelles : ELMO et BERT Vue d'ensemble

Couvre les représentations contextuelles en PNL, en se concentrant sur les architectures ELMO et BERT et leurs applications dans diverses tâches.

Réseaux d'approvisionnement en énergie

Introduit des réseaux de flux, couvrant la structure du réseau neuronal, la formation, les fonctions d'activation et l'optimisation, avec des applications en prévision et finance.

Formation des classificateurs de sentiments binaires

Couvre la formation d'un classificateur de sentiment binaire à l'aide d'un RNN.

Représentations contextuelles: ELMo & BERT

Explore le développement d'intégrations contextuelles dans le NLP, en mettant l'accent sur les progrès réalisés par ELMo et BERT et son impact sur les tâches du NLP.

Pré-entraînement : BiLSTM et Transformateur

Plongez dans les modèles BiLSTM et Transformer de pré-formation pour les tâches NLP, en démontrant leur efficacité et leurs applications.

Propriétés théoriques des RNN

Explore les propriétés théoriques et la puissance pratique des réseaux neuronaux récurrents, y compris leur relation avec les machines d'état et l'exhaustivité de Turing.

Techniques d'apprentissage profond: Réseaux récurrents et modèles LSTM

Discute de la mise en œuvre et de l'optimisation de réseaux récurrents utilisant des modèles LSTM en apprentissage profond.

Évaluation du gradient de la politique : Exemple (horizon à 1 étape)

Explore l'évaluation du gradient des politiques avec un horizon en 1 étape, met à jour les règles, les comparaisons avec Perceptron et la biologie, et les techniques de généralisation.

Marquage partie de la parole: modèles probabilistes

Explore le marquage en utilisant des modèles probabilistes comme Hidden Markov Models et discute de la résolution des ambiguïtés lexicales.