Séances de cours associées à Mesure de similarité

Découverte avancée de la structure : données sur les distances et les séries chronologiques

Explore les algorithmes de clustering, les mesures de distance et les techniques d'analyse de données de séries chronologiques.

Techniques de résolution des entités

Explore les techniques de résolution d'entités, la déduplication des données, les métriques de similitude, le coût de calcul, les techniques de blocage et l'échelle des jointures de similarité.

Temporalité et résolution des entités

Explore les défis dans la temporalité des données et les techniques de résolution des entités.

Distances et nombres de motifs

Explore les distances sur les graphiques, les normes de coupe, les arbres de couverture, les modèles de blocs, les métriques, les normes et les ERGM dans l'analyse des données du réseau.

Mesure des graphiques: analyse statistique

Explore les mesures graphiques et l'analyse statistique dans le regroupement de réseaux, y compris les ERGM application en sociologie et asymptotique.

Propriétés ergonomiques de systèmes symboliques de faible complexité

Explore l'influence de la complexité sur les propriétés ergonomiques des systèmes symboliques, présentant le théorème Curtis-Hedlund-Lyndon et les constructions de sous-postes minimaux.

Résumé des données : Minhashing et Locality-Sensitive Hashing

Explore la similarité Jaccard, le minhashing et le hachage sensible à la localité pour le résumé des données.

Compression des données : Techniques de préservation de la vie privée

Explore les techniques de gestion des données et de récapitulation des données qui permettent de trouver des éléments semblables.

Apprentissage supervisé : arbre k-NN et arbre de décision

Introduit l'apprentissage supervisé avec k-NN et les arbres de décision, couvrant les techniques, les exemples et les méthodes d'ensemble.

Analyse par grappes : méthodes et applications

Explore les méthodes et applications d'analyse de grappes dans l'analyse des données génomiques, y compris la classification, l'expression des gènes, la visualisation, les mesures de distance et les algorithmes de regroupement.

L'Impact Canvas : Utilisation de l'outil

Présente l'outil Impact Canvas pour l'innovation technologique dans le développement durable.

KNN Classifier : Approche du voisin le plus proche

Explique le classificateur K-Nearest Neighbors, en attribuant des étiquettes basées sur les points les plus proches et en lissant le bruit dans les étiquettes.

Fonctions hyperboliques: Tangent et Cotangent

Couvre les définitions et les exemples de fonctions hyperboliques tangentes et cotangentes.

Gestion des données de protection de la vie privée : opérations et protocoles

Explore les opérations de gestion des données préservant la vie privée et les techniques de résumé pour la protection des données sensibles.

Systèmes de recommandation: Partie 1

Introduit les systèmes de recommandation, le filtrage collaboratif, la recommandation basée sur le contenu, les paramètres de similitude et la factorisation matricielle.

Recommender Systems: Aperçu et méthodes

Explore l'évolution des recommandateurs, du filtrage collaboratif, du prix Netflix, de la formation sur les modèles et des techniques d'optimisation.

Gaussian Naive Bayes & K-NN

Couvre les bayes naïfs gaussiens, les voisins les plus proches du K et le réglage hyperparamétrique dans l'apprentissage automatique.

Prédiction du lien : bords manquants et méthodes probabilistes

Explore la prédiction des liens dans les réseaux, couvrant les bords manquants, les méthodes probabilistes et les défis d'inférence causale.

Systèmes Recommender: Bases et Techniques

Couvre le filtrage collaboratif et les méthodes basées sur le contenu pour les systèmes de recommandation, en abordant les problèmes de démarrage à froid et en faisant des prédictions.

Codes de correction d'erreur : Bases

Introduit les canaux d'effacement et d'erreur, la distance d'hamming et les codes de correction d'erreur.