Séance de cours

Mise à l'échelle des modèles de langage : efficacité et déploiement

Séances de cours associées (31)

Deep Learning : principes et applications

Couvre les principes fondamentaux de l'apprentissage profond, y compris les données, l'architecture et les considérations éthiques dans le déploiement de modèles.

Compression du modèle: Techniques pour des modèles NLP efficaces

Explore les techniques de compression des modèles dans les NLP, en discutant de la taille, de la quantification, de la factorisation du poids, de la distillation des connaissances et des mécanismes d'attention.

Techniques d'apprentissage profond: Réseaux récurrents et modèles LSTM

Discute de la mise en œuvre et de l'optimisation de réseaux récurrents utilisant des modèles LSTM en apprentissage profond.

Modèles linguistiques : réseaux neuronaux à contexte fixe et récurrents

Discute des modèles de langage, en se concentrant sur les modèles neuronaux à contexte fixe et les réseaux neuronaux récurrents.

Démarrage et alignement

Explore l'incitation, l'alignement et les capacités des grands modèles de langage pour les tâches de traitement du langage naturel.

Apprentissage automatique: Techniques d'apprentissage supervisé et non supervisé

Couvre les techniques d'apprentissage supervisées et non supervisées dans l'apprentissage automatique, en mettant en évidence leurs applications dans la finance et l'analyse environnementale.

Transformers en vision : applications et architectures

Couvre l'impact des transformateurs dans la vision par ordinateur, en discutant de leur architecture, de leurs applications et de leurs progrès dans diverses tâches.

Compression du modèle de deuxième commande

Explore la compression du modèle de deuxième ordre pour les réseaux neuronaux profonds massifs, montrant les techniques de compression et leur impact sur la précision du modèle.

Annotation des données : collecte et biais dans la PNL

Aborde la collecte de données, les processus d'annotation et les biais dans le traitement du langage naturel.

Traitement du langage naturel: comprendre les transformateurs et la tokenisation

Fournit un aperçu du traitement du langage naturel, en se concentrant sur les transformateurs, la tokenisation et les mécanismes d'auto-attention pour une analyse et une synthèse efficaces du langage.

Traitement du langage naturel : un amorceur

Introduit le traitement du langage naturel (NLP) et ses applications, couvrant la tokenisation, l'apprentissage automatique, l'analyse du sentiment et les applications NLP suisses.

Intégrations de mots neuronaux: Représentations d'apprentissage pour le langage naturel

Couvre les incorporations de mots neuronaux et les méthodes d'apprentissage des représentations de mots dans le traitement du langage naturel.

Deep Learning pour répondre aux questions

Explore l'apprentissage profond pour répondre aux questions, analyser les réseaux neuronaux et modéliser la robustesse au bruit.

Optimisation des réseaux neuraux

Explore l'optimisation des réseaux neuronaux, y compris la rétropropagation, la normalisation des lots, l'initialisation du poids et les stratégies de recherche d'hyperparamètres.

Réseaux neuronaux pour la PNL

Couvre les approches modernes du réseau neuronal en matière de PNL, en mettant l'accent sur l'intégration de mots, les réseaux neuronaux pour les tâches de PNL et les futures techniques d'apprentissage par transfert.

Modèles Vision-Langue-Action : Formation et applications

Se penche sur la formation et les applications des modèles Vision-Language-Action, en mettant l'accent sur le rôle des grands modèles linguistiques dans le contrôle robotique et le transfert des connaissances web. Les résultats des expériences et les orientations futures de la recherche sont mis en évidence.

Architecture des transformateurs : mécanismes d'attention subquadratiques

Couvre l'architecture du transformateur, en se concentrant sur les modèles codeurs-décodeurs et les mécanismes d'attention subquadratiques pour un traitement efficace des séquences d'entrée.

Analyse des composantes principales : réduction de la dimensionnalité

Couvre l'analyse des composantes principales pour la réduction de dimensionnalité, en explorant ses applications, ses limites et l'importance de choisir les composantes appropriées.

Introduction aux marchés financiers et aux séries chronologiques

Introduit les marchés financiers, les séries chronologiques, les applications d'apprentissage automatique en finance et le traitement des langues naturelles.

Modèles de séquence de préformation: BART et T5

Couvre la préformation des modèles séquence à séquence, en se concentrant sur les architectures BART et T5.