Séance de cours

Sans titre

Séances de cours associées (28)

Explore l'évolution des NLP modernes de GPT-2 à GPT-3, en mettant l'accent sur l'apprentissage en contexte et le développement de ChatGPT.

Modèles Vision-Langue-Action : Formation et applications

Se penche sur la formation et les applications des modèles Vision-Language-Action, en mettant l'accent sur le rôle des grands modèles linguistiques dans le contrôle robotique et le transfert des connaissances web. Les résultats des expériences et les orientations futures de la recherche sont mis en évidence.

Préformation: Transformateurs et modèles

Explore les modèles de préformation comme BERT, T5 et GPT, en discutant de leurs objectifs de formation et de leurs applications dans le traitement des langues naturelles.

Modèles de langage: De la théorie à l'informatique

Explore les mathématiques des modèles de langues, couvrant la conception de l'architecture, la pré-formation et l'ajustement fin, soulignant l'importance de la pré-formation et de l'ajustement fin pour diverses tâches.

Modèles de séquence de préformation: BART et T5

Couvre la préformation des modèles séquence à séquence, en se concentrant sur les architectures BART et T5.

Transformers: Techniques de pré-entraînement et de décodage

Couvre les concepts avancés de transformateur, en se concentrant sur les techniques de pré-formation et de décodage en PNL.

Annotation des données : collecte et biais dans la PNL

Aborde la collecte de données, les processus d'annotation et les biais dans le traitement du langage naturel.

Démarrage et alignement

Explore l'incitation, l'alignement et les capacités des grands modèles de langage pour les tâches de traitement du langage naturel.

Pré-entraînement : BiLSTM et Transformateur

Plongez dans les modèles BiLSTM et Transformer de pré-formation pour les tâches NLP, en démontrant leur efficacité et leurs applications.

Réseaux neuronaux : formation et activation

Explore les réseaux neuronaux, les fonctions d'activation, la rétropropagation et l'implémentation de PyTorch.

Le PNL moderne et l'éthique dans le PNL

Se penche sur les progrès et les défis du PNL, ainsi que sur les considérations éthiques et les préjudices potentiels.

Représentations contextuelles : ELMO et BERT Vue d'ensemble

Couvre les représentations contextuelles en PNL, en se concentrant sur les architectures ELMO et BERT et leurs applications dans diverses tâches.

Traitement du langage naturel: comprendre les transformateurs et la tokenisation

Fournit un aperçu du traitement du langage naturel, en se concentrant sur les transformateurs, la tokenisation et les mécanismes d'auto-attention pour une analyse et une synthèse efficaces du langage.

BERT: Préformation et Applications

Se penche sur la préformation BERT pour les transformateurs, discutant de ses applications dans les tâches de PNL.

Mise à l'échelle des modèles de langage : efficacité et déploiement

Couvre la mise à l'échelle des modèles linguistiques, en mettant l'accent sur l'efficacité de la formation et les considérations de déploiement.

Deep Learning pour le NLP

Explore l'apprentissage profond pour la PNL, en couvrant les insertions de mots, les représentations contextuelles, les techniques d'apprentissage et les défis tels que les gradients de disparition et les considérations éthiques.

Représentations contextuelles: ELMo & BERT

Explore le développement d'intégrations contextuelles dans le NLP, en mettant l'accent sur les progrès réalisés par ELMo et BERT et son impact sur les tâches du NLP.

Séquence à modèles de séquence: vue d'ensemble et applications

Couvre les modèles de séquence à séquence, leur architecture, leurs applications et le rôle des mécanismes d'attention dans l'amélioration des performances.

Optimisation des réseaux neuraux

Explore l'optimisation des réseaux neuronaux, y compris la rétropropagation, la normalisation des lots, l'initialisation du poids et les stratégies de recherche d'hyperparamètres.

Deep Learning : principes et applications

Couvre les principes fondamentaux de l'apprentissage profond, y compris les données, l'architecture et les considérations éthiques dans le déploiement de modèles.