Kubernetes 中 Resource Requests 和 Limits 有什麼差別？如何設定？

Question

Accepted Answer

Requests vs Limits Requests（請求量）：容器保證能獲得的資源量，Scheduler 根據此值決定將 Pod 排程到哪個節點。 Limits（上限）：容器能使用的最大資源量，超過後： CPU：被 throttling（限速），不會被殺死 Memory：觸發 OOMKilled，容器被強制終止 設定範例 resources: requests: memory: "128Mi" cpu: "250m" # 250 millicores = 0.25 核 limits: memory: "256Mi" cpu: "500m" QoS 等級 根據 requests/limits 設定，Kubernetes 自動分配 QoS 等級，決定資源不足時的驅逐優先順序： | QoS 等級 | 條件 | 驅逐優先順序 | |---------|------|------------| | Guaranteed | requests == limits | 最後被驅逐 | | Burstable | 有 requests，limits > requests | 中等 | | Bes…

Kubernetes 中 Resource Requests 和 Limits 有什麼差別？如何設定？

Requests vs Limits

設定範例

QoS 等級

HPA（水平自動擴展）

最佳實踐

QoS 等級	條件	驅逐優先順序
Guaranteed	requests == limits	最後被驅逐
Burstable	有 requests，limits > requests	中等
BestEffort	未設定任何 requests/limits	最先被驅逐