Explore l'extraction de connaissances à partir du texte, couvrant des concepts clés tels que l'extraction de phrases clés et la reconnaissance d'entités nommées.
Explore l'indexation sémantique latente, la construction de vocabulaire, la création de matrices de documents, la transformation de requêtes et la récupération de documents en utilisant la similarité cosinus.
Explore la désambiguïsation des entités, reliant le texte aux bases de connaissances et la prédiction de liens dans les graphiques de connaissances avec des exemples de Wikipedia.
Explore les arbres de décision, de l'induction à l'élagage, en mettant l'accent sur l'interprétabilité et les forces de sélection automatique des fonctionnalités, tout en abordant des défis tels que l'ajustement excessif.
Explore l'inférence des connaissances pour les graphiques, en discutant de la propagation des étiquettes, des objectifs d'optimisation et du comportement probabiliste.
Explore les forêts aléatoires en tant que méthode d'ensemble puissante pour la classification, en discutant des stratégies d'ensachage, d'empilage, de renforcement et d'échantillonnage.
Discute de l'importance de la collecte de données et de la préparation à la classification, y compris les défis d'étiquetage et les méthodes de crowdsourcing.
Explore les algorithmes de distribution et d'agrégation des tâches de crowdsourcing pour les réponses des travailleurs dans la méthodologie de classification.
Explore les méthodes de discrétisation, y compris les techniques d'égale largeur et d'égale fréquence, ainsi que les statistiques x2 pour les tests d'indépendance.
Explore les mesures d'évaluation des modèles, les techniques de sélection, le compromis biais-variance et la gestion des distributions de données biaisées dans l'apprentissage automatique.
Explore les systèmes de recommandation, le filtrage collaboratif, les recommandations basées sur le contenu, les mesures de similarité et les méthodes avancées telles que la factorisation matricielle.