Explore le traitement de grands textes numériques, révélant des modèles et des structures cachés, et la convergence des sciences humaines et de la linguistique computationnelle.
Présente les bases de la récupération d'informations, couvrant la récupération basée sur le texte, les caractéristiques du document, les fonctions de similarité et la différence entre la récupération booléenne et la récupération classée.
Explore le modèle Vector Space, le sac de mots, tf-idf, cosine similarité, Okapi BM25, et la précision et le rappel dans la récupération d'information.
Souligne l'importance des incompatibilités pour prévenir les conflits d'intérêts et maintenir la démocratie, en prônant une loi constitutionnelle en la matière.