Séance de cours

Modèles de texte: Word Embeddings et modèles de sujet

Séances de cours associées (31)

L'adhésion des mots : modèles et apprentissage

Explore l'intégration de mots, l'importance du contexte et les algorithmes d'apprentissage pour créer de nouvelles représentations.

Texte de manipulation : Récupération de documents, classification, analyse des sentiments

Explore la recherche de documents, la classification, l'analyse des sentiments, les matrices TF-IDF, les méthodes de voisinage les plus proches, la factorisation matricielle, la régularisation, LDA, les vecteurs de mots contextualisés et BERT.

Sémantique spatiale vectorielle (et récupération d'information)

Explore le modèle Vector Space, le sac de mots, tf-idf, cosine similarité, Okapi BM25, et la précision et le rappel dans la récupération d'information.

Indexation sémantique latente

Couvre l'indexation sémantique latente, l'intégration de mots, et le modèle de skipgram avec un échantillonnage négatif.

Modèles du sujet: Allocation de dirichlet latent

Présente l'attribution des dirichlets latents pour la modélisation des sujets dans les documents, en discutant de son processus, de ses demandes et de ses limites.

Optimisation de l'apprentissage automatique

Explore les techniques d'optimisation, l'intégration de mots et les systèmes de recommandation dans l'apprentissage automatique.

Modèles du sujet: Comprendre les structures latentes

Explore les modèles thématiques, les modèles de mélange gaussien, la répartition des dirichlets latents et l'inférence variationnelle dans la compréhension des structures latentes à l'intérieur des données.

Word Embeddings: Modèles et applications

Explore les intégrations de mots, les modèles tels que CBOW et Skipgram, Fasttext, Glove, les intégrations de sous-mots et leurs applications dans la recherche et la classification de documents.

Modèles thématiques

Introduit des modèles thématiques, couvrant le clustering, le GMM, le LDA, la distribution de Dirichlet et l'inférence variationnelle.

Traitement de texte : Analyse de grandes collections de texte numérique

Plongez dans le traitement de grandes collections de textes numériques, en explorant les régularités cachées, la réutilisation du texte et l'analyse TF-IDF.

Réseaux bayésiens : principes fondamentaux et applications

Couvre les fondamentaux des réseaux bayésiens et leurs applications dans la modélisation probabiliste de sujets.

Recherche et classification de documents

Couvre la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets à l'aide de matrices TF-IDF et de vecteurs de mots contextualisés tels que BERT.

Régression linéaire probabiliste

Examine la régression probabiliste linéaire, couvrant les probabilités articulaires et conditionnelles, la régression des crêtes et l'atténuation excessive.

Incorporer des modèles : concepts et récupération

Couvre les modèles d'intégration pour la récupération de documents, l'indexation sémantique latente, le SVD et les modèles thématiques.

Traitement de texte: Matrice, Documents, Sujets

Explore la gestion du texte, en se concentrant sur les matrices, les documents et les sujets, y compris les défis de la classification des documents et des modèles avancés comme BERT.

Inférence variable et réseaux neuraux

Couvre l'inférence variationnelle et les réseaux neuronaux pour les tâches de classification.

Indexation sémantique latente : concepts et applications

Explore l'indexation sémantique latente, une technique de cartographie des documents dans un espace conceptuel pour la recherche et la classification.

Densité des États et inférence bayésienne en mathématiques computationnelles

Explorer la densité de calcul des états et l'inférence bayésienne à l'aide d'un échantillonnage d'importance, montrant une variance inférieure et la parallélisation de la méthode proposée.

Intégrations de mots neuronaux: Représentations d'apprentissage pour le langage naturel

Couvre les incorporations de mots neuronaux et les méthodes d'apprentissage des représentations de mots dans le traitement du langage naturel.

Modèles d'intégration de mots : Optimisation et applications

Explore l'optimisation des modèles d'intégration de mots, y compris la minimisation de la fonction de perte et la descente de gradient, et introduit des techniques comme Fasttext et Byte Pair Encoding.