Kubernetes 元件 SLI 指標
用於衡量 Kubernetes 元件可靠性和效能的高級別指標。
特性狀態:
Kubernetes v1.27 [beta]
(預設啟用:true)預設情況下,Kubernetes 1.34 會為每個 Kubernetes 元件二進位制檔案釋出服務級別指標 (SLI)。此指標端點透過每個元件的服務 HTTPS 埠暴露,路徑為 /metrics/slis
。自 v1.27 起,ComponentSLIs
特性門預設啟用,適用於所有 Kubernetes 元件。
SLI 指標
啟用 SLI 指標後,每個 Kubernetes 元件會針對每個健康檢查暴露兩個指標,並附帶標籤:
- 一個 Gauge(表示健康檢查的當前狀態)
- 一個 Counter(記錄每個健康檢查狀態的累計計數)
您可以使用這些指標資訊來計算每個元件的可用性統計資料。例如,API 伺服器會檢查 etcd 的健康狀況。您可以計算並報告 etcd 的可用或不可用情況——由其客戶端(API 伺服器)報告。
Prometheus Gauge 資料看起來如下:
# HELP kubernetes_healthcheck [ALPHA] This metric records the result of a single healthcheck.
# TYPE kubernetes_healthcheck gauge
kubernetes_healthcheck{name="autoregister-completion",type="healthz"} 1
kubernetes_healthcheck{name="autoregister-completion",type="readyz"} 1
kubernetes_healthcheck{name="etcd",type="healthz"} 1
kubernetes_healthcheck{name="etcd",type="readyz"} 1
kubernetes_healthcheck{name="etcd-readiness",type="readyz"} 1
kubernetes_healthcheck{name="informer-sync",type="readyz"} 1
kubernetes_healthcheck{name="log",type="healthz"} 1
kubernetes_healthcheck{name="log",type="readyz"} 1
kubernetes_healthcheck{name="ping",type="healthz"} 1
kubernetes_healthcheck{name="ping",type="readyz"} 1
而 Counter 資料看起來如下:
# HELP kubernetes_healthchecks_total [ALPHA] This metric records the results of all healthcheck.
# TYPE kubernetes_healthchecks_total counter
kubernetes_healthchecks_total{name="autoregister-completion",status="error",type="readyz"} 1
kubernetes_healthchecks_total{name="autoregister-completion",status="success",type="healthz"} 15
kubernetes_healthchecks_total{name="autoregister-completion",status="success",type="readyz"} 14
kubernetes_healthchecks_total{name="etcd",status="success",type="healthz"} 15
kubernetes_healthchecks_total{name="etcd",status="success",type="readyz"} 15
kubernetes_healthchecks_total{name="etcd-readiness",status="success",type="readyz"} 15
kubernetes_healthchecks_total{name="informer-sync",status="error",type="readyz"} 1
kubernetes_healthchecks_total{name="informer-sync",status="success",type="readyz"} 14
kubernetes_healthchecks_total{name="log",status="success",type="healthz"} 15
kubernetes_healthchecks_total{name="log",status="success",type="readyz"} 15
kubernetes_healthchecks_total{name="ping",status="success",type="healthz"} 15
kubernetes_healthchecks_total{name="ping",status="success",type="readyz"} 15
使用這些資料
元件 SLI 指標端點旨在高頻率地被抓取。高頻率抓取意味著您將獲得更精細的 Gauge 訊號粒度,可用於計算 SLO。/metrics/slis
端點提供計算相應 Kubernetes 元件可用性 SLO 所需的原始資料。
最後修改時間 2025 年 1 月 7 日 下午 8:06 PST:為 Kubernetes 元件 SLI 指標新增描述 (6c83f61fa5)