串流處理 基礎

真正串流 vs 微批次處理

AI 練習作答

請說明真正串流處理與微批次處理的差異。

真正串流(True Streaming)

每條訊息到達即立即處理,延遲可達毫秒至秒級。

代表:Apache Flink、Kafka Streams

優點:超低延遲。

缺點:實作複雜(狀態管理、Watermark)、成本較高。

微批次(Micro-Batch)

每隔固定時間(如 1 秒、10 秒)收集一批資料,以小批量方式處理。延遲通常在秒到分鐘級。

代表:Apache Spark Structured Streaming

優點:實作相對簡單(近似批次邏輯)、吞吐量高。

缺點:延遲高於真正串流;批次邊界可能導致時間計算不精確。

選擇依據

  • 需要毫秒級延遲(詐騙偵測、即時推薦):真正串流(Flink)
  • 秒到分鐘延遲可接受(即時 Dashboard、監控告警):微批次(Spark Streaming)
  • 已有 Spark 技術棧:優先考慮 Spark Structured Streaming

延遲比較

批次(小時/天)> 微批次(秒/分鐘)> 真正串流(毫秒/秒)

✦ AI 模擬面試

輸入你的答案,AI 即時分析精準度與改進空間

登入後即可使用 AI 評分