Séance de cours

Séquence aux modèles de séquence: Aperçu et mécanismes d'attention

Séances de cours associées (31)

Séquence à modèles de séquence: vue d'ensemble et applications

Couvre les modèles de séquence à séquence, leur architecture, leurs applications et le rôle des mécanismes d'attention dans l'amélioration des performances.

Deep Learning pour le NLP

Introduit des concepts d'apprentissage profond pour les NLP, couvrant l'intégration de mots, les RNN et les Transformateurs, mettant l'accent sur l'auto-attention et l'attention multi-têtes.

Transformers: Techniques de pré-entraînement et de décodage

Couvre les concepts avancés de transformateur, en se concentrant sur les techniques de pré-formation et de décodage en PNL.

Transformers : Révolutionner les mécanismes d’attention en PNL

Couvre le développement des transformateurs et leur impact sur les mécanismes d'attention en PNL.

Systèmes de connaissances non conceptuels

Explore l'impact de l'apprentissage profond sur les humanités numériques, en se concentrant sur les systèmes de connaissances non conceptuels et les progrès récents de l'IA.

Traitement du langage naturel: comprendre les transformateurs et la tokenisation

Fournit un aperçu du traitement du langage naturel, en se concentrant sur les transformateurs, la tokenisation et les mécanismes d'auto-attention pour une analyse et une synthèse efficaces du langage.

Traduction automatique : Mécanisme d'attention

Explore le mécanisme d'attention dans la traduction automatique, en s'attaquant au problème du goulot d'étranglement et en améliorant considérablement les performances NMT.

Fondements de l'apprentissage profond: Aperçu de l'architecture transformatrice

Couvre les concepts fondamentaux de l'apprentissage profond et de l'architecture Transformer, en se concentrant sur les réseaux neuronaux, les mécanismes d'attention et leurs applications dans les tâches de modélisation de séquence.

Deep Learning pour le NLP

Explore l'apprentissage profond pour la PNL, en couvrant les insertions de mots, les représentations contextuelles, les techniques d'apprentissage et les défis tels que les gradients de disparition et les considérations éthiques.

Réseaux de neurones récurrents: formation et défis

Discute des réseaux neuronaux récurrents, de leurs défis de formation et de solutions telles que les LSTM et les GRU.

Modèles de génération profonde: Partie 2

Explore les modèles générateurs profonds, y compris les mélanges de multinômes, PCA, autoencodeurs profonds, autoencodeurs convolutionnels, et GANs.

Traduction automatique neuronale

Explore l'évolution et les défis des systèmes de traduction automatique neuronale et les mesures d'évaluation utilisées dans ce domaine.

Traduction automatique: séquence à séquence et attention

Explore les progrès de la traduction automatique, en mettant l'accent sur les modèles de séquence à séquence et les mécanismes d'attention.

Réseaux de mémoire à court terme

Introduit les réseaux de mémoire à long terme (LSTM) comme une solution pour la disparition et l'explosion des gradients dans les réseaux neuronaux récurrents.

Réseaux neuronaux pour la PNL

Couvre les approches modernes du réseau neuronal en matière de PNL, en mettant l'accent sur l'intégration de mots, les réseaux neuronaux pour les tâches de PNL et les futures techniques d'apprentissage par transfert.

Réseaux neuronaux : Réseau neuronal à deux couches

Couvre les bases des réseaux neuraux, en mettant l'accent sur le développement des réseaux neuraux de deux couches vers les réseaux neuraux profonds.

Transformateurs dans la vision

Explore l'évolution des modèles d'intelligence visuelle, en mettant l'accent sur les Transformateurs et leurs applications dans la vision informatique et le traitement du langage naturel.

Deep Learning pour le NLP

En savoir plus sur l'apprentissage profond pour le traitement des langues naturelles, l'exploration de l'intégration des mots neuraux, des réseaux neuraux récurrents et de la modélisation des neurones avec les transformateurs.

Deep Learning: Réseaux neuronaux récurrents

Explore les réseaux neuronaux récurrents pour les données comportementales, couvrant le repérage de connaissances profondes, les réseaux LSTM, GRU, le réglage hyperparamétrique et les tâches de prévision de séries chronologiques.

Modèles de langage classique: fondements et applications

Présente des modèles de langage classiques, leurs applications et des concepts fondamentaux tels que la modélisation et les mesures d'évaluation basées sur le nombre.