Séance de cours

Cartes cognitives chez les rats et les hommes

Séances de cours associées (30)

Modèles génériques : auto-attention et transformateurs

Couvre les modèles générateurs en mettant l'accent sur l'auto-attention et les transformateurs, en discutant des méthodes d'échantillonnage et des moyens empiriques.

De l'attention aux transformateurs

Explore l'évolution des mécanismes d'attention vers les transformateurs dans les NLP modernes, en soulignant l'importance de l'auto-attention et de l'attention croisée.

Transformers: Techniques de pré-entraînement et de décodage

Couvre les concepts avancés de transformateur, en se concentrant sur les techniques de pré-formation et de décodage en PNL.

Architecture des transformateurs : le X Gomega

Déplacez-vous dans l'architecture Transformer, l'auto-attention et les stratégies de formation pour la traduction automatique et la reconnaissance d'image.

Transformer: Pre-Training

Explore le modèle Transformer, des modèles récurrents à la PNL basée sur l'attention, en mettant en évidence ses composants clés et ses résultats significatifs dans la traduction automatique et la génération de documents.

Traitement du langage naturel: comprendre les transformateurs et la tokenisation

Fournit un aperçu du traitement du langage naturel, en se concentrant sur les transformateurs, la tokenisation et les mécanismes d'auto-attention pour une analyse et une synthèse efficaces du langage.

Préformation: Transformateurs et modèles

Explore les modèles de préformation comme BERT, T5 et GPT, en discutant de leurs objectifs de formation et de leurs applications dans le traitement des langues naturelles.

Séquence aux modèles de séquence: Aperçu et mécanismes d'attention

Explore la séquence des modèles de séquence, les mécanismes d'attention et leur rôle dans le traitement des limites des modèles et l'amélioration de l'interprétation.

Transformers : pré-entraînement

Discute des défis et des progrès dans les transformateurs, les modèles de préformation et la tokenisation des sous-mots en PNL.

Transformers en vision : applications et architectures

Couvre l'impact des transformateurs dans la vision par ordinateur, en discutant de leur architecture, de leurs applications et de leurs progrès dans diverses tâches.

Modèles de séquence de préformation: BART et T5

Couvre la préformation des modèles séquence à séquence, en se concentrant sur les architectures BART et T5.

Transformateurs: Vue d'ensemble et auto-attention

Fournit un aperçu des Transformateurs, de l'auto-attention, de l'attention multi-têtes, et du décodeur et de l'encodeur Transformateur.

Séquence à modèles de séquence: vue d'ensemble et applications

Couvre les modèles de séquence à séquence, leur architecture, leurs applications et le rôle des mécanismes d'attention dans l'amélioration des performances.

Réactions chimiques : Architecture des transformateurs

Explore la cartographie des atomes dans les réactions chimiques et la transition vers la grammaire réactionnelle à l'aide de l'architecture du transformateur.

Deep Learning pour le NLP

Explore l'apprentissage profond pour la PNL, en couvrant les insertions de mots, les représentations contextuelles, les techniques d'apprentissage et les défis tels que les gradients de disparition et les considérations éthiques.

BERT: Préformation et Applications

Se penche sur la préformation BERT pour les transformateurs, discutant de ses applications dans les tâches de PNL.

Modèles de langage: De la théorie à l'informatique

Explore les mathématiques des modèles de langues, couvrant la conception de l'architecture, la pré-formation et l'ajustement fin, soulignant l'importance de la pré-formation et de l'ajustement fin pour diverses tâches.

Transformers : l’auto-attention et le MLP

Explore les transformateurs, en mettant l'accent sur l'auto-attention et les mécanismes MLP pour un traitement de séquence efficace.

Modèles de génération profonde: Partie 2

Explore les modèles générateurs profonds, y compris les mélanges de multinômes, PCA, autoencodeurs profonds, autoencodeurs convolutionnels, et GANs.

Fondements de l'apprentissage profond: Aperçu de l'architecture transformatrice

Couvre les concepts fondamentaux de l'apprentissage profond et de l'architecture Transformer, en se concentrant sur les réseaux neuronaux, les mécanismes d'attention et leurs applications dans les tâches de modélisation de séquence.