【共筆】Data Engineering Zoomcamp 》時程總表

▌課程及討論時間

共學進行方式:討論該週上課內容及交流作業的解決方案

  • 課程開始時間:1/12

  • 共學討論時間:星期日晚上8點(1/18開始)

Zoom 註冊連結

提醒:加入 zoom 會議,必須先註冊,註冊完成 zoom 會寄送專屬連結到你的註冊 email。

▌暫估時程

日期 主題 導讀 筆記 錄影
1月4日 說明會 Howard - -
1月18日 Module 1: Containerization and Infrastructure as Code - 筆記 YouTube
1月25日 Module 2: Workflow Orchestration - 筆記 YouTube
2月1日 Module 3: Data Warehousing - 筆記 YouTube
2月7日 Module 4: Analytics Engineering - 筆記 YouTube
2月8日 Module 5: Batch Processing - 筆記 YouTube
2月15日 Module 6: Streaming - 筆記 YouTube
2月22日 - 筆記 YouTube
3月1日 - 筆記 YouTube

▌課程大綱

Module (模組) What You’ll Learn (學習內容) Tools & Technologies
1. Infrastructure & Prerequisites • Set up your development environment with Docker and PostgreSQL
• Learn cloud basics with GCP
• Master infrastructure-as-code using Terraform
Docker, PostgreSQL, GCP, Terraform
2. Workflow Orchestration • Master data pipeline orchestration with Mage.AI
• Implement and manage Data Lakes using Google Cloud Storage
• Build automated, reproducible workflows
Mage.AI, Google Cloud Storage
3. Data Warehouse • Deep dive into BigQuery for enterprise data warehousing
• Learn optimization techniques like partitioning and clustering
• Implement best practices for data storage and retrieval
BigQuery
4. Analytics Engineering • Transform raw data into analytics-ready models using dbt
• Develop testing and documentation strategies
• Create impactful visualizations with modern BI tools
dbt, BI tools
5. Batch Processing • Process large-scale data with Apache Spark
• Master Spark SQL and DataFrame operations
• Optimize batch processing workflows
Apache Spark, Spark SQL
6. Stream Processing • Build real-time data pipelines with Kafka
• Develop streaming applications using KSQL and Faust
• Implement stream processing patterns
Kafka, KSQL, Faust
Final Project • Build an end-to-end data pipeline from ingestion to visualization
• Apply all learned concepts in a real-world project
• Create a portfolio-ready project with documentation
Cloud platforms (GCP/AWS/Azure), Terraform, Spark, Kafka, dbt, BigQuery

▌講師 Telegram & Slack

▌課程介紹

▌課程 Github

▌課程影片

課前 Q&A

播放清單

DataTalksClub 主頁


▌參考資訊

》其他

Data Science Roadmap 資料科學—學習路線圖

如何提高完課率(我對共同學習的一些想法)

大會報告:公開錄影

本論壇共學,討論錄影皆公開上傳 YouTube,不同意者請不要參與共學,感謝配合。

祝大家學習順利大成功!