Séance de cours

Introduction à la récupération d'information

Séances de cours associées (32)

Indexation sémantique latente : concepts et applications

Explore l'indexation sémantique latente, une technique de cartographie des documents dans un espace conceptuel pour la recherche et la classification.

Sémantique spatiale vectorielle (et récupération d'information)

Explore le modèle Vector Space, le sac de mots, tf-idf, cosine similarité, Okapi BM25, et la précision et le rappel dans la récupération d'information.

Données de base sur la récupération de l'information

Introduit les bases de la recherche de l'information, couvrant la recherche par texte et booléen, la recherche de l'espace vectoriel et le calcul de la similitude.

Bases de recherche d'information: Vue d'ensemble et recherche textuelle

Couvre les bases de la recherche de l'information, y compris les techniques de recherche et d'indexation basées sur le texte.

Indexation sémantique latente

Couvre l'indexation sémantique latente, l'intégration de mots, et le modèle de skipgram avec un échantillonnage négatif.

Texte de manipulation : Récupération de documents, classification, analyse des sentiments

Explore la recherche de documents, la classification, l'analyse des sentiments, les matrices TF-IDF, les méthodes de voisinage les plus proches, la factorisation matricielle, la régularisation, LDA, les vecteurs de mots contextualisés et BERT.

Incorporer des modèles : concepts et récupération

Couvre les modèles d'intégration pour la récupération de documents, l'indexation sémantique latente, le SVD et les modèles thématiques.

Données de base sur la récupération de l'information

Présente les bases de la récupération d'informations, couvrant la représentation de documents, l'expansion des requêtes et TF-IDF pour le classement des documents.

Indexation des données : Indexation sémantique latente

Explore l'indexation sémantique latente dans la récupération d'information, en discutant des algorithmes, des défis dans la récupération spatiale vectorielle et des méthodes de récupération axées sur le concept.

Recherche et classification de documents

Couvre la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets à l'aide de matrices TF-IDF et de vecteurs de mots contextualisés tels que BERT.

Indexation sémantique latente : fichiers inversés

Explore les indices de décalage terminologique dans les fichiers inversés et les solutions de rétroaction de pertinence.

Récupération probabiliste

Couvre la récupération d'informations probabilistes, la pertinence de la modélisation en tant que probabilité, l'expansion des requêtes et la génération automatique de thésaurus.

Habillements de mots: Gants et relations sémantiques

Explore les ancrages de mots, le modèle de gants, les relations sémantiques, les ancrages de sous-mots et les relations syntaxiques.

Sémantique lexicale

Explore la sémantique lexicale, le sens des mots, les relations sémantiques et WordNet, en mettant en évidence les applications dans l'ingénierie du langage et la récupération d'informations.

Indexation sémantique latente : concepts et applications

Explore l'indexation sémantique latente, la construction de vocabulaire, la création de matrices de documents, la transformation de requêtes et la récupération de documents en utilisant la similarité cosinus.

Récupération d'information: espace vectoriel

Couvre les bases de la récupération d'informations à l'aide de modèles d'espace vectoriel et d'exercices pratiques sur la rétroaction de pertinence et la numérisation de la liste de publication.

Word Embeddings: Modèles et applications

Explore les intégrations de mots, les modèles tels que CBOW et Skipgram, Fasttext, Glove, les intégrations de sous-mots et leurs applications dans la recherche et la classification de documents.

Classement basé sur les liens: fondamentaux et algorithmes

Couvre les fondamentaux et les algorithmes du classement basé sur les liens, y compris l'indexation de texte d'ancrage, PageRank, HITS, et les implémentations pratiques.

Indexation et récupération distribuée

Explore les techniques d'indexation, les fichiers inversés, les algorithmes de réduction de carte et les méthodes de récupération de documents haut de gamme dans les systèmes de récupération de texte.

Indexation sémantique latente

Couvre l'indexation sémantique latente, une méthode pour améliorer la récupération d'informations en cartographiant des documents et des requêtes dans un espace conceptuel de dimension inférieure.