可觀測性 基礎
可觀測性的三大支柱是什麼?Metrics、Logs、Traces 各自的用途?
可觀測性 vs 監控
監控(Monitoring):預先定義你想觀察的指標(已知的未知)
可觀測性(Observability):能夠從系統外部的輸出推斷系統內部狀態,回答未預見的問題(未知的未知)
三大支柱
Metrics(指標)
數字形式的時序資料,用於量化系統行為。
- 特點:低儲存成本、高效聚合、適合警報和 Dashboard
- 用途:CPU 使用率、請求 QPS、錯誤率、P99 延遲
- 工具:Prometheus + Grafana、CloudWatch、Datadog
Logs(日誌)
事件的文字記錄,包含發生了什麼、何時、附帶上下文。
- 特點:資訊豐富但儲存成本高,難以跨服務關聯
- 用途:錯誤詳情、使用者行為、審計追蹤
- 工具:ELK Stack(Elasticsearch+Logstash+Kibana)、Loki、Splunk
Traces(追蹤)
記錄單一請求跨越多個服務的完整路徑。
- 特點:揭示分散式系統中的效能瓶頸和依賴關係
- 用途:找出哪個服務造成請求延遲、服務調用鏈分析
- 工具:Jaeger、Zipkin、AWS X-Ray、Tempo
三者的互補關係
- Metrics 告訴你「有問題了」(錯誤率上升)
- Logs 告訴你「發生了什麼」(具體錯誤訊息)
- Traces 告訴你「在哪裡出問題」(哪個服務、哪個資料庫查詢)
✦ AI 模擬面試
輸入你的答案,AI 即時分析精準度與改進空間
登入後即可使用 AI 評分
