DOMAIN

資料工程

30

SQL 視窗函數(Window Functions)

SQL 與資料轉換 中階

SQL JOIN 類型詳解

SQL 與資料轉換 基礎

SQL CTE 與遞迴查詢

SQL 與資料轉換 中階

資料管道編排:Apache Airflow

Pipeline 編排 中階

ETL vs ELT:資料管道模式比較

Pipeline 編排 基礎

變更資料擷取(CDC)

Pipeline 編排 進階

資料品質監控

Pipeline 編排 中階

OLAP vs OLTP:分析型 vs 交易型資料庫

資料倉儲建模 基礎

dbt 資料轉換工作流

資料倉儲建模 中階

串流處理的視窗與時間語意

串流處理 進階

Apache Spark 核心架構

批次處理 中階

串流處理的訊息語意:Exactly-Once vs At-Least-Once

串流處理 進階

資料管道的冪等性設計

Pipeline 編排 中階

批次處理設計模式

批次處理 中階

Spark 效能調優

批次處理 進階

資料格式:Parquet vs ORC vs CSV

批次處理 基礎

MapReduce 計算範式

批次處理 基礎

真正串流 vs 微批次處理

串流處理 基礎

Lambda 架構 vs Kappa 架構

串流處理 進階

Apache Kafka 核心概念

串流處理 中階

資料倉儲分區與叢集(Partitioning & Clustering)

資料倉儲建模 中階

資料倉儲 vs 資料湖 vs 資料湖倉

資料倉儲建模 基礎

維度建模:星型架構與雪花架構

資料倉儲建模 中階

SQL 交易與 ACID 特性

SQL 與資料轉換 基礎

SQL 查詢優化:EXPLAIN 與執行計畫

SQL 與資料轉換 中階

資料品質的六大維度是什麼?

資料品質與可觀測性 基礎

什麼是資料血緣 (Data Lineage)?如何追蹤它?

資料品質與可觀測性 中階

如何在資料 Pipeline 中實作異常偵測?

資料品質與可觀測性 中階

什麼是資料目錄 (Data Catalog)?它解決什麼問題?

資料品質與可觀測性 基礎

資料可觀測性的五大支柱是什麼?如何建立完整的監控體系?

資料品質與可觀測性 進階