Explore le traitement des données texte, en dérivant des ensembles de données propres à partir de textes non structurés, et diverses techniques d'analyse de texte.
Présente les bases du traitement de données textuelles, couvrant la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets.
Présente les bases de l'analyse de données textuelles, couvrant la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets à l'aide de techniques de prétraitement et de modèles d'apprentissage automatique.
Explore la recherche de documents, la classification, l'analyse des sentiments et la détection de sujets dans l'analyse de texte à l'aide de modèles d'apprentissage supervisé et de sacs de mots.
Couvre la recherche de documents, la classification, l'analyse des sentiments et la détection de sujets à l'aide de matrices TF-IDF et de vecteurs de mots contextualisés.
Introduit la classification des documents en utilisant des fonctionnalités telles que les mots et les métadonnées, et des modèles tels que k-Nearest-Neighbors et word embeddings.
Introduit les bases de la récupération d'informations, couvrant l'indexation, les schémas de pondération, la similarité cosinus et l'évaluation des requêtes.
Introduit le traitement du langage naturel, qui couvre le prétraitement du texte, l'analyse des sentiments et l'analyse des sujets, en mettant l'accent sur l'établissement d'un indice de risque pour le changement climatique.
Explore les transformateurs et les MLP pour la classification des documents, en mettant l'accent sur leurs avantages par rapport aux méthodes traditionnelles.
Introduit les bases de la recherche de l'information, couvrant la recherche par texte et booléen, la recherche de l'espace vectoriel et le calcul de la similitude.
Explore le modèle Vector Space, le sac de mots, tf-idf, cosine similarité, Okapi BM25, et la précision et le rappel dans la récupération d'information.
Présente les bases de la récupération d'informations, couvrant la représentation de documents, l'expansion des requêtes et TF-IDF pour le classement des documents.
Explore les mots, les jetons et les modèles de langage en PNL, couvrant les défis liés à leur définition, à l'utilisation du lexique, aux n-grammes et à l'estimation des probabilités.
Explore la recherche de documents, la classification, l'analyse des sentiments, les matrices TF-IDF, les méthodes de voisinage les plus proches, la factorisation matricielle, la régularisation, LDA, les vecteurs de mots contextualisés et BERT.
Couvre la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets à l'aide de matrices TF-IDF et de vecteurs de mots contextualisés tels que BERT.