Concept

Transformeur

Séances de cours associées (30)

Explore le modèle Transformer, des modèles récurrents à la PNL basée sur l'attention, en mettant en évidence ses composants clés et ses résultats significatifs dans la traduction automatique et la génération de documents.

Représentations contextuelles: ELMo & BERT

Explore le développement d'intégrations contextuelles dans le NLP, en mettant l'accent sur les progrès réalisés par ELMo et BERT et son impact sur les tâches du NLP.

Architecture des transformateurs : le X Gomega

Déplacez-vous dans l'architecture Transformer, l'auto-attention et les stratégies de formation pour la traduction automatique et la reconnaissance d'image.

Transformers en vision : applications et architectures

Couvre l'impact des transformateurs dans la vision par ordinateur, en discutant de leur architecture, de leurs applications et de leurs progrès dans diverses tâches.

Préformation: Transformateurs et modèles

Explore les modèles de préformation comme BERT, T5 et GPT, en discutant de leurs objectifs de formation et de leurs applications dans le traitement des langues naturelles.

Pré-entraînement : BiLSTM et Transformateur

Plongez dans les modèles BiLSTM et Transformer de pré-formation pour les tâches NLP, en démontrant leur efficacité et leurs applications.

Transformers: Unifier les communautés d'apprentissage automatique

Couvre le rôle des transformateurs dans l'unification de divers domaines d'apprentissage automatique.

Réseaux de transformateurs : auto-attention

Explique les réseaux de transformateurs et les couches d'auto-attention pour la cartographie des entrées et l'attention multi-têtes.

Transformers: Techniques de pré-entraînement et de décodage

Couvre les concepts avancés de transformateur, en se concentrant sur les techniques de pré-formation et de décodage en PNL.

Transformateurs: Vue d'ensemble et auto-attention

Fournit un aperçu des Transformateurs, de l'auto-attention, de l'attention multi-têtes, et du décodeur et de l'encodeur Transformateur.

Transformateurs : Architecture complète et mécanisme d'auto-attention

Explique l'architecture complète des Transformateurs et le mécanisme d'auto-attention, en soulignant le changement de paradigme vers l'utilisation de modèles complètement préformés.

De l'attention aux transformateurs

Explore l'évolution des mécanismes d'attention vers les transformateurs dans les NLP modernes, en soulignant l'importance de l'auto-attention et de l'attention croisée.

Représentations contextuelles : ELMO et BERT Vue d'ensemble

Couvre les représentations contextuelles en PNL, en se concentrant sur les architectures ELMO et BERT et leurs applications dans diverses tâches.

Transformateurs dans la vision

Explore Transformers dans la vision informatique, se concentrant sur l'architecture 'Attention est tout ce dont vous avez besoin' et ses applications dans les tâches visuelles.

Modèles de langage: De la théorie à l'informatique

Explore les mathématiques des modèles de langues, couvrant la conception de l'architecture, la pré-formation et l'ajustement fin, soulignant l'importance de la pré-formation et de l'ajustement fin pour diverses tâches.

Deep Learning pour le NLP

Introduit des concepts d'apprentissage profond pour les NLP, couvrant l'intégration de mots, les RNN et les Transformateurs, mettant l'accent sur l'auto-attention et l'attention multi-têtes.

Deep Learning pour le NLP

Explore l'apprentissage profond pour la PNL, en couvrant les insertions de mots, les représentations contextuelles, les techniques d'apprentissage et les défis tels que les gradients de disparition et les considérations éthiques.

Traitement du langage naturel: comprendre les transformateurs et la tokenisation

Fournit un aperçu du traitement du langage naturel, en se concentrant sur les transformateurs, la tokenisation et les mécanismes d'auto-attention pour une analyse et une synthèse efficaces du langage.

Modèles de séquence de préformation: BART et T5

Couvre la préformation des modèles séquence à séquence, en se concentrant sur les architectures BART et T5.

Modèles génériques : auto-attention et transformateurs

Couvre les modèles générateurs en mettant l'accent sur l'auto-attention et les transformateurs, en discutant des méthodes d'échantillonnage et des moyens empiriques.