Pipeline 編排 進階

變更資料擷取(CDC)

AI 練習作答

請說明 CDC 的工作原理及使用場景。

什麼是 CDC

Change Data Capture(變更資料擷取)是一種追蹤資料庫中資料變更(INSERT/UPDATE/DELETE)的技術,並將這些變更即時推送到下游系統。

工作原理

大多數 CDC 工具(如 Debezium)透過讀取資料庫的事務日誌(MySQL Binlog、PostgreSQL WAL)來捕獲變更,而非輪詢資料庫,影響生產負載極低。

流程

資料庫事務日誌 → CDC 工具(Debezium) → Kafka Topic → 下游消費者(資料倉儲、快取、搜尋索引)

使用場景

  • 資料庫同步:將 OLTP 資料即時同步到分析資料倉儲。
  • 快取失效:資料庫更新後自動清除對應 Redis 快取。
  • 搜尋索引同步:資料庫更新後自動更新 Elasticsearch。
  • 審計日誌:記錄所有資料庫變更的完整歷史。

優點 vs 定時批次

CDC 實現近即時資料同步(延遲秒級),批次同步通常有小時至天的延遲。

✦ AI 模擬面試

輸入你的答案,AI 即時分析精準度與改進空間

登入後即可使用 AI 評分