Séances de cours associées à Présentation du module Utilisateurs clés de l'équipement

Gestion de projet : Gestion de portefeuille

Se concentre sur la planification, l'exécution et la participation des utilisateurs clés pour une gestion de projet efficace.

Science collaborative des données : outils et techniques

Introduit des outils collaboratifs de science des données comme Git et Docker, en mettant l'accent sur le travail d'équipe et les exercices pratiques pour un apprentissage efficace.

Introduction générale à la science des données

Offre une introduction complète à la science des données, couvrant Python, Numpy, Pandas, Matplotlib et Scikit-learn, en mettant l'accent sur les exercices pratiques et le travail collaboratif.

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Défis de nettoyage des données : Optimisation de la détection des erreurs

S'attaque aux défis du nettoyage des données pour l'analyse, proposant des optimisations pour réduire le temps de traitement.

Écosystèmes Big Data : technologies et défis

Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.

Tests logiciels : éviter et corriger les bugs

Souligne le rôle essentiel des tests logiciels dans la prévention et la résolution des bogues pendant le développement.

Agent Gitlab pour Kubernetes (agentk)

Couvre la configuration d'un agent Gitlab pour Kubernetes, en mettant l'accent sur l'installation, le contrôle de version et le dépannage.

Introduction à la programmation R pour la génétique et la génomique

Introduit un cours sur la génétique et la génomique, en se concentrant sur la programmation R avec des exercices interactifs.

Manipulation des données : modèles de données et embrouillement

Examine les éléments fondamentaux de la gestion des données, y compris les modèles, les sources et les querelles, en soulignant l'importance de comprendre et de résoudre les problèmes de données.

Big Data: Meilleures pratiques et lignes directrices

Couvre les pratiques exemplaires et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture typique, les défis et les technologies utilisés pour y remédier.

Entreposage des données : aperçu et défis

Présente les fondamentaux de l'entreposage de données, les défis et le concept novateur de «lakehouse».

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Visite des services d'hébergement Web Legacy

Couvre une visite des anciens services d'hébergement Web et des discussions sur le stockage futur des services.

Qualité des logiciels: Gestion des défauts et des stratégies d'essai

Explore la gestion des défauts, des stratégies d'essai et des défis en matière de qualité des logiciels, avec des exemples du monde réel et des études de cas.

Surajustement: symptômes et caractéristiques

Explore le surajustement dans la régression polynomiale, en soulignant l'importance de la généralisation dans l'apprentissage automatique et les statistiques.

Défis de la santé mondiale : Médecine régénératrice et éthique

Explore les défis de santé mondiale en médecine régénérative et en éthique, en guidant les étudiants sur le développement de projets et l'évaluation critique.

L'essentiel de la science des données

Couvre l'essentiel de la science des données, y compris le traitement, la visualisation et l'analyse des données, en mettant l'accent sur les compétences pratiques et l'engagement actif.

Analyse des composantes principales : réduction des dimensions

Couvre l'analyse en composantes principales pour la réduction dimensionnelle des données biologiques, en se concentrant sur la visualisation et l'identification des modèles.

Modélisation des données : concepts et applications

Explore les concepts de modélisation de données, les implémentations SQL et les applications pratiques dans la gestion des données manquantes.