Concept

Sac de mots

Séances de cours associées (19)

Analyse des données textuelles : Techniques et applications

Explore le traitement des données texte, en dérivant des ensembles de données propres à partir de textes non structurés, et diverses techniques d'analyse de texte.

Traitement de données texte: bases et techniques

Présente les bases du traitement de données textuelles, couvrant la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets.

Analyse des données textuelles: bases et techniques

Présente les bases de l'analyse de données textuelles, couvrant la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets à l'aide de techniques de prétraitement et de modèles d'apprentissage automatique.

Texte de manipulation: Récupération de documents et classification

Explore la recherche de documents, la classification, l'analyse des sentiments et la détection de sujets dans l'analyse de texte à l'aide de modèles d'apprentissage supervisé et de sacs de mots.

Traitement des données textuelles : recherche de documents et classification

Couvre la recherche de documents, la classification, l'analyse des sentiments et la détection de sujets à l'aide de matrices TF-IDF et de vecteurs de mots contextualisés.

Reconnaissance visuelle profonde : Interprétabilité

Explore la reconnaissance visuelle profonde, l'interprétation, les architectures CNN, les dictionnaires visuels et les mécanismes d'attention.

Classification des documents: Caractéristiques et modèles

Introduit la classification des documents en utilisant des fonctionnalités telles que les mots et les métadonnées, et des modèles tels que k-Nearest-Neighbors et word embeddings.

Récupérer l'information : bases et techniques

Introduit les bases de la récupération d'informations, couvrant l'indexation, les schémas de pondération, la similarité cosinus et l'évaluation des requêtes.

Traitement des langues naturelles

Introduit le traitement du langage naturel, qui couvre le prétraitement du texte, l'analyse des sentiments et l'analyse des sujets, en mettant l'accent sur l'établissement d'un indice de risque pour le changement climatique.

Classification des documents

Explore les méthodes de classification des documents, y compris Naïve Bayes et word embeddings.

Classification des documents: Transformateurs et MLPs

Explore les transformateurs et les MLP pour la classification des documents, en mettant l'accent sur leurs avantages par rapport aux méthodes traditionnelles.

Données de base sur la récupération de l'information

Introduit les bases de la recherche de l'information, couvrant la recherche par texte et booléen, la recherche de l'espace vectoriel et le calcul de la similitude.

Exercice de récupération d'espace vectoriel

Couvre le calcul TF-IDF, les vecteurs de documents, la similarité cosinus et les formules de précision.

Sémantique spatiale vectorielle (et récupération d'information)

Explore le modèle Vector Space, le sac de mots, tf-idf, cosine similarité, Okapi BM25, et la précision et le rappel dans la récupération d'information.

Données de base sur la récupération de l'information

Présente les bases de la récupération d'informations, couvrant la représentation de documents, l'expansion des requêtes et TF-IDF pour le classement des documents.

Mots-clés : Lexical Level Overview

Explore les mots, les jetons et les modèles de langage en PNL, couvrant les défis liés à leur définition, à l'utilisation du lexique, aux n-grammes et à l'estimation des probabilités.

Multiplication de la matrice: Bases et propriétés

Couvre les bases de la multiplication matricielle, y compris les propriétés et les exemples.

Texte de manipulation : Récupération de documents, classification, analyse des sentiments

Explore la recherche de documents, la classification, l'analyse des sentiments, les matrices TF-IDF, les méthodes de voisinage les plus proches, la factorisation matricielle, la régularisation, LDA, les vecteurs de mots contextualisés et BERT.

Recherche et classification de documents

Couvre la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets à l'aide de matrices TF-IDF et de vecteurs de mots contextualisés tels que BERT.