Concept

Text-to-image model

Séances de cours associées (31)

Préformation: Transformateurs et modèles

Explore les modèles de préformation comme BERT, T5 et GPT, en discutant de leurs objectifs de formation et de leurs applications dans le traitement des langues naturelles.

Modèles de séquence de préformation: BART et T5

Couvre la préformation des modèles séquence à séquence, en se concentrant sur les architectures BART et T5.

Transformers: Techniques de pré-entraînement et de décodage

Couvre les concepts avancés de transformateur, en se concentrant sur les techniques de pré-formation et de décodage en PNL.

Transformateurs : Architecture complète et mécanisme d'auto-attention

Explique l'architecture complète des Transformateurs et le mécanisme d'auto-attention, en soulignant le changement de paradigme vers l'utilisation de modèles complètement préformés.

Transformers : pré-entraînement

Discute des défis et des progrès dans les transformateurs, les modèles de préformation et la tokenisation des sous-mots en PNL.

Les systèmes d’image sociale : du passé au présent

Explore l'évolution des systèmes d'image sociale, des modèles d'apprentissage en profondeur, des selfies et de la biométrie sur les plateformes en ligne.

Optimisation des réseaux neuraux

Explore l'optimisation des réseaux neuronaux, y compris la rétropropagation, la normalisation des lots, l'initialisation du poids et les stratégies de recherche d'hyperparamètres.

NLP moderne: Collecte de données, annotation et anomalies

Explore l'annotation des données dans le NLP et l'impact des biais sur le réglage fin du modèle.

Annotation des données : collecte et biais dans la PNL

Aborde la collecte de données, les processus d'annotation et les biais dans le traitement du langage naturel.

Modèles de séquence à séquence: BART + T5

Explore les modèles de séquence à séquence avec BART et T5, en discutant de l'apprentissage du transfert, du réglage fin, des architectures de modèles, des tâches, de la comparaison des performances, des résultats de synthèse et des références.

Modèles génériques basés sur les scores

Déplacez-vous dans des modèles générateurs basés sur les scores, explorant les distributions naturelles d'apprentissage et l'impact de l'architecture de réseau neuronal sur la robustesse.

Modélisation generative: Alors, maintenant et demain?

Explore l'évolution de la modélisation générative, depuis les méthodes traditionnelles jusqu'aux progrès de pointe, en passant par les défis à relever et en envisageant les possibilités futures.

Modèles de génération profonde: Codeurs automatiques et GANs

Explore les codeurs automatiques et les réseaux d'adversaires génériques pour la modélisation generative profonde.

Fondements de l'apprentissage automatique

Couvre les principes fondamentaux, les opportunités et les défis de l'apprentissage automatique.

Estimation de la pose à la main

Couvre l'estimation de la pose de la main, les techniques de régression et l'évolution des modèles de classification d'images de LeNet à VGG19.

Résolution de coréférence : Modèles et évaluation

Explore les modèles de résolution de coréférence, les défis dans les échelles de notation, les techniques de raffinement des graphiques, les résultats de pointe et l'impact des transformateurs préentraînés.

Transformer: Pre-Training

Explore le modèle Transformer, des modèles récurrents à la PNL basée sur l'attention, en mettant en évidence ses composants clés et ses résultats significatifs dans la traduction automatique et la génération de documents.

Deep Learning : réseaux neuronaux convolutifs

Couvre les réseaux neuronaux convolutifs, les architectures standard, les techniques de formation et les exemples contradictoires en apprentissage profond.

Modèles linguistiques : réseaux neuronaux à contexte fixe et récurrents

Discute des modèles de langage, en se concentrant sur les modèles neuronaux à contexte fixe et les réseaux neuronaux récurrents.

Représentations contextuelles : ELMO et BERT Vue d'ensemble

Couvre les représentations contextuelles en PNL, en se concentrant sur les architectures ELMO et BERT et leurs applications dans diverses tâches.