Se concentre sur le projet final, guidant les étudiants sur la création d'une histoire de données et d'un pitch vidéo pour leur analyse d'extension créative.
Explore les techniques et les applications de la visualisation des données, en soulignant l'importance d'une communication efficace et d'exemples non conventionnels.
Introduit des concepts de modélisation de données, l'utilisation de SQL et des applications de bibliothèque Pandas pour un traitement efficace des données.
Introduit des statistiques descriptives, une quantification de l'incertitude et des relations variables, soulignant l'importance de l'interprétation statistique et de l'analyse critique.
Explore les principes de visualisation des données, y compris la navigation des cartes, les histogrammes, les diagrammes de dispersion, les diagrammes de boîte et l'utilisation des couleurs.
Introduit des statistiques descriptives, des tests d'hypothèses, des valeurs p et des intervalles de confiance, soulignant leur importance dans l'analyse des données.
Couvre l'analyse de régression pour les données de désassemblage à l'aide de la modélisation de régression linéaire, des transformations, des interprétations des coefficients et des modèles linéaires généralisés.
Couvre l'analyse causale des données d'observation, des pièges, des outils permettant de tirer des conclusions valables et d'aborder les variables confusionnelles.
S'insère dans l'analyse de régression, en mettant l'accent sur le rôle des prédicteurs linéaires dans le rapprochement des résultats et en discutant des modèles linéaires généralisés et des techniques d'inférence causale.
Introduit les bases de la régression linéaire, de l'interprétation des coefficients, des hypothèses, des transformations et de la «différence des différences» pour l'analyse causale.
Couvre les principes fondamentaux de la science des données, l'évolution des méthodes scientifiques, le rôle d'un data scientist et l'importance des données en tant que nouveau pétrole.
Explore les défis des études observationnelles, en soulignant l'importance de la randomisation et de l'analyse de sensibilité pour tirer des conclusions valables à partir de «données trouvées».
Couvre les bases de l'apprentissage automatique, l'apprentissage supervisé et non supervisé, diverses techniques comme les voisins k-nearest et les arbres de décision, et les défis de l'ajustement excessif.