串流處理 基礎
真正串流 vs 微批次處理
請說明真正串流處理與微批次處理的差異。
真正串流(True Streaming)
每條訊息到達即立即處理,延遲可達毫秒至秒級。
代表:Apache Flink、Kafka Streams
優點:超低延遲。
缺點:實作複雜(狀態管理、Watermark)、成本較高。
微批次(Micro-Batch)
每隔固定時間(如 1 秒、10 秒)收集一批資料,以小批量方式處理。延遲通常在秒到分鐘級。
代表:Apache Spark Structured Streaming
優點:實作相對簡單(近似批次邏輯)、吞吐量高。
缺點:延遲高於真正串流;批次邊界可能導致時間計算不精確。
選擇依據
- 需要毫秒級延遲(詐騙偵測、即時推薦):真正串流(Flink)
- 秒到分鐘延遲可接受(即時 Dashboard、監控告警):微批次(Spark Streaming)
- 已有 Spark 技術棧:優先考慮 Spark Structured Streaming
延遲比較
批次(小時/天)> 微批次(秒/分鐘)> 真正串流(毫秒/秒)
✦ AI 模擬面試
輸入你的答案,AI 即時分析精準度與改進空間
登入後即可使用 AI 評分
