可觀測性的三大支柱是什麼？Metrics、Logs、Traces 各自的用途？

Question

Accepted Answer

可觀測性 vs 監控 監控（Monitoring）：預先定義你想觀察的指標（已知的未知） 可觀測性（Observability）：能夠從系統外部的輸出推斷系統內部狀態，回答未預見的問題（未知的未知） 三大支柱 Metrics（指標） 數字形式的時序資料，用於量化系統行為。 特點：低儲存成本、高效聚合、適合警報和 Dashboard 用途：CPU 使用率、請求 QPS、錯誤率、P99 延遲 工具：Prometheus + Grafana、CloudWatch、Datadog Logs（日誌） 事件的文字記錄，包含發生了什麼、何時、附帶上下文。 特點：資訊豐富但儲存成本高，難以跨服務關聯 用途：錯誤詳情、使用者行為、審計追蹤 工具：ELK Stack（Elasticsearch+Logstash+Kibana）、Loki、Splunk Traces（追蹤） 記錄單一請求跨越多個服務的完整路徑。 特點：揭示分散式系統中的效能瓶頸和依賴關係 用途：找出哪個服務造成請求延遲、服務調用鏈分析 工具：Jaeger、Zipkin、AWS X-Ray、Tempo 三者的互補關係 Metrics 告訴你…