Séance de cours

Transformers : pré-entraînement

Séances de cours associées (30)

Préformation: Transformateurs et modèles

Explore les modèles de préformation comme BERT, T5 et GPT, en discutant de leurs objectifs de formation et de leurs applications dans le traitement des langues naturelles.

Transformers: Techniques de pré-entraînement et de décodage

Couvre les concepts avancés de transformateur, en se concentrant sur les techniques de pré-formation et de décodage en PNL.

Modèles de séquence de préformation: BART et T5

Couvre la préformation des modèles séquence à séquence, en se concentrant sur les architectures BART et T5.

Transformateurs : Architecture complète et mécanisme d'auto-attention

Explique l'architecture complète des Transformateurs et le mécanisme d'auto-attention, en soulignant le changement de paradigme vers l'utilisation de modèles complètement préformés.

Représentations contextuelles : ELMO et BERT Vue d'ensemble

Couvre les représentations contextuelles en PNL, en se concentrant sur les architectures ELMO et BERT et leurs applications dans diverses tâches.

Pré-entraînement : BiLSTM et Transformateur

Plongez dans les modèles BiLSTM et Transformer de pré-formation pour les tâches NLP, en démontrant leur efficacité et leurs applications.

BERT: Préformation et Applications

Se penche sur la préformation BERT pour les transformateurs, discutant de ses applications dans les tâches de PNL.

Représentations contextuelles: ELMo & BERT

Explore le développement d'intégrations contextuelles dans le NLP, en mettant l'accent sur les progrès réalisés par ELMo et BERT et son impact sur les tâches du NLP.

Modèles de langage: De la théorie à l'informatique

Explore les mathématiques des modèles de langues, couvrant la conception de l'architecture, la pré-formation et l'ajustement fin, soulignant l'importance de la pré-formation et de l'ajustement fin pour diverses tâches.

Transformer: Pre-Training

Explore le modèle Transformer, des modèles récurrents à la PNL basée sur l'attention, en mettant en évidence ses composants clés et ses résultats significatifs dans la traduction automatique et la génération de documents.

Le PNL moderne et l'éthique dans le PNL

Se penche sur les progrès et les défis du PNL, ainsi que sur les considérations éthiques et les préjudices potentiels.

Modèles génériques : auto-attention et transformateurs

Couvre les modèles générateurs en mettant l'accent sur l'auto-attention et les transformateurs, en discutant des méthodes d'échantillonnage et des moyens empiriques.

Traitement du langage naturel: comprendre les transformateurs et la tokenisation

Fournit un aperçu du traitement du langage naturel, en se concentrant sur les transformateurs, la tokenisation et les mécanismes d'auto-attention pour une analyse et une synthèse efficaces du langage.

Deep Learning pour le NLP

Explore l'apprentissage profond pour la PNL, en couvrant les insertions de mots, les représentations contextuelles, les techniques d'apprentissage et les défis tels que les gradients de disparition et les considérations éthiques.

Résolution de coréférence : Modèles et évaluation

Explore les modèles de résolution de coréférence, les défis dans les échelles de notation, les techniques de raffinement des graphiques, les résultats de pointe et l'impact des transformateurs préentraînés.

Décodage à partir de modèles neuraux

Explore le décodage à partir de modèles neuronaux dans le NLP moderne, couvrant les modèles encodeurs-décodeurs, les algorithmes de décodage, les problèmes avec le décodage argmax, et l'impact de la taille du faisceau.

Transformateurs: Vue d'ensemble et auto-attention

Fournit un aperçu des Transformateurs, de l'auto-attention, de l'attention multi-têtes, et du décodeur et de l'encodeur Transformateur.

De l'attention aux transformateurs

Explore l'évolution des mécanismes d'attention vers les transformateurs dans les NLP modernes, en soulignant l'importance de l'auto-attention et de l'attention croisée.

Transformers en vision : applications et architectures

Couvre l'impact des transformateurs dans la vision par ordinateur, en discutant de leur architecture, de leurs applications et de leurs progrès dans diverses tâches.

Modèles de séquence à séquence: BART + T5

Explore les modèles de séquence à séquence avec BART et T5, en discutant de l'apprentissage du transfert, du réglage fin, des architectures de modèles, des tâches, de la comparaison des performances, des résultats de synthèse et des références.