可觀測性 基礎

可觀測性的三大支柱是什麼?Metrics、Logs、Traces 各自的用途?

AI 練習作答

可觀測性 vs 監控

監控(Monitoring):預先定義你想觀察的指標(已知的未知)

可觀測性(Observability):能夠從系統外部的輸出推斷系統內部狀態,回答未預見的問題(未知的未知)

三大支柱

Metrics(指標)

數字形式的時序資料,用於量化系統行為。

  • 特點:低儲存成本、高效聚合、適合警報和 Dashboard
  • 用途:CPU 使用率、請求 QPS、錯誤率、P99 延遲
  • 工具:Prometheus + Grafana、CloudWatch、Datadog

Logs(日誌)

事件的文字記錄,包含發生了什麼、何時、附帶上下文。

  • 特點:資訊豐富但儲存成本高,難以跨服務關聯
  • 用途:錯誤詳情、使用者行為、審計追蹤
  • 工具:ELK Stack(Elasticsearch+Logstash+Kibana)、Loki、Splunk

Traces(追蹤)

記錄單一請求跨越多個服務的完整路徑。

  • 特點:揭示分散式系統中的效能瓶頸和依賴關係
  • 用途:找出哪個服務造成請求延遲、服務調用鏈分析
  • 工具:Jaeger、Zipkin、AWS X-Ray、Tempo

三者的互補關係

  • Metrics 告訴你「有問題了」(錯誤率上升)
  • Logs 告訴你「發生了什麼」(具體錯誤訊息)
  • Traces 告訴你「在哪裡出問題」(哪個服務、哪個資料庫查詢)

✦ AI 模擬面試

輸入你的答案,AI 即時分析精準度與改進空間

登入後即可使用 AI 評分