Pipeline 編排 進階
變更資料擷取(CDC)
請說明 CDC 的工作原理及使用場景。
什麼是 CDC
Change Data Capture(變更資料擷取)是一種追蹤資料庫中資料變更(INSERT/UPDATE/DELETE)的技術,並將這些變更即時推送到下游系統。
工作原理
大多數 CDC 工具(如 Debezium)透過讀取資料庫的事務日誌(MySQL Binlog、PostgreSQL WAL)來捕獲變更,而非輪詢資料庫,影響生產負載極低。
流程
資料庫事務日誌 → CDC 工具(Debezium) → Kafka Topic → 下游消費者(資料倉儲、快取、搜尋索引)
使用場景
- 資料庫同步:將 OLTP 資料即時同步到分析資料倉儲。
- 快取失效:資料庫更新後自動清除對應 Redis 快取。
- 搜尋索引同步:資料庫更新後自動更新 Elasticsearch。
- 審計日誌:記錄所有資料庫變更的完整歷史。
優點 vs 定時批次
CDC 實現近即時資料同步(延遲秒級),批次同步通常有小時至天的延遲。
✦ AI 模擬面試
輸入你的答案,AI 即時分析精準度與改進空間
登入後即可使用 AI 評分
