云原生时代的监控介绍
可观测性指标
CNCF 根据可观测性和数据规律将可观测指标分为四类:
- 指标监控(Metrics):根据不同指标产生的时序数据,监控系统如 Prometheus 等
- 日志监控(Logging):日志或事件,日志系统如 loki、ElasticSearch 等
- 链路跟踪(Tracing):分布式应用系统的调用链跟踪,如 jaeger、Zipkin 等
- 其他:混沌工程系统,如 Chaos Monkey 等
监控的核心指标
延迟(Latency)
:如 HTTP 请求时延
流量(Traffic)
:如单位时间内处理 HTTP 请求数,数据库处理事务量
错误(Errors)
:如单位时间内出现的错误数量和类型
饱和度(Saturation)或使用率(Utilization)
:服务器资源的使用情况,如 CPU、内存使用率等
USE 方法适用于主机监控指标:
- 使用率(Utilization)
- 饱和度(Saturation)
- 错误(Errors)
RED 方法是基于 Prometheus 和 Kubernetes 容器总价的方法论,可以帮助衡量云原生以及微服务应用的体验,它关注3个关键指标:
(Request)Rate
:单位时间内请求数量
(Request)Errors
:单位时间内错误数量
(Request)Duration
:每个请求花费的时间