Lectures related to Data Wrangling: Structuring and Cleaning Data

Data Modeling: Concepts and Applications

Explores data modeling concepts, SQL implementations, and practical applications in handling missing data.

Data Wrangling with Hive: Managing Big Data Efficiently

Covers data wrangling techniques using Apache Hive for efficient big data management.

Offers a comprehensive introduction to Data Science, covering Python, Numpy, Pandas, Matplotlib, and Scikit-learn, with a focus on practical exercises and collaborative work.

Handling Data: Data Models and Wrangling

Explores data handling fundamentals, including models, sources, and wrangling, emphasizing the importance of understanding and addressing data problems.

Data Wrangling: ETL Process and Wrangling Issues

Explores the ETL process, data wrangling stages, and common issues.

Data Science: Python for Engineers - Part II

Explores data wrangling, numerical data handling, and scientific visualization using Python for engineers.

Data Wrangling: Transforming Data for Analysis

Covers the process of data wrangling, focusing on transforming and preparing data for analysis.

Data Wrangling and Analysis

Covers a homework assignment on data wrangling and analysis using Python's pandas library for real-world datasets.

Collaborative Data Science: Tools and Techniques

Introduces collaborative data science tools like Git and Docker, emphasizing teamwork and practical exercises for effective learning.

Data Wrangling with Hadoop: Advanced Techniques

Covers advanced data wrangling techniques using Hadoop, focusing on Hive and HBase integration.

Data Wrangling: Structuring and Wrangling Issues

Covers data wrangling stages, structuring techniques, and common issues in data preparation.

Introduction to Data Stream Processing: Concepts and Applications

Covers the principles of data stream processing and its applications in real-time data analysis.

Data Wrangling Techniques: HBase and Hive Integration

Covers data wrangling techniques using HBase and Hive, focusing on integration and practical applications.

Data Wrangling with Hadoop: Storage Formats and Hive

Explores data wrangling with Hadoop, emphasizing storage formats and Hive for big data processing.

Data Warehousing: Overview and Challenges

Introduces data warehousing fundamentals, challenges, and the innovative concept of a 'lakehouse'.

Advanced Spark Optimization Techniques: Managing Big Data

Discusses advanced Spark optimization techniques for managing big data efficiently, focusing on parallelization, shuffle operations, and memory management.

Data Visualization: Principles and Practices

Emphasizes the importance of data visualization techniques and practices for effective data analysis and communication.

Data Cleaning Challenges: Optimizing Error Detection

Addresses challenges in data cleaning for analysis, proposing optimizations to reduce processing time.

Data Wrangling with Hadoop

Covers data wrangling techniques using Hadoop, focusing on row versus column-oriented databases, popular storage formats, and HBase-Hive integration.

Data Modeling: Concepts and Applications

Introduces data modeling concepts, SQL usage, and Pandas library applications for efficient data processing.