Explore les techniques de résolution d'entités, la déduplication des données, les métriques de similitude, le coût de calcul, les techniques de blocage et l'échelle des jointures de similarité.
Explore les distances sur les graphiques, les normes de coupe, les arbres de couverture, les modèles de blocs, les métriques, les normes et les ERGM dans l'analyse des données du réseau.
Explore l'influence de la complexité sur les propriétés ergonomiques des systèmes symboliques, présentant le théorème Curtis-Hedlund-Lyndon et les constructions de sous-postes minimaux.
Explore les méthodes et applications d'analyse de grappes dans l'analyse des données génomiques, y compris la classification, l'expression des gènes, la visualisation, les mesures de distance et les algorithmes de regroupement.
Explique le classificateur K-Nearest Neighbors, en attribuant des étiquettes basées sur les points les plus proches et en lissant le bruit dans les étiquettes.
Introduit les systèmes de recommandation, le filtrage collaboratif, la recommandation basée sur le contenu, les paramètres de similitude et la factorisation matricielle.
Couvre le filtrage collaboratif et les méthodes basées sur le contenu pour les systèmes de recommandation, en abordant les problèmes de démarrage à froid et en faisant des prédictions.