分类
标签
ACG AI ai blog Blogging chatgpt chrome clickhouse cloki Customization Demo discuss Example Fuwari game gin git gitalk golang grafana ilogtai index jwt k8s kubectl mac Markdown mazeball metrics mysql PC Privacy Policies prometheus scurity siri software sqlite thanos twikoo vercel Video Windows yaml zookeeper 企划 动漫 实用 容器化 应用部署 技术 日常 智能插座 杂谈 游戏 游戏开发 源码研究 绘图 编程 聊天 运维 集群 音乐
187 字
1 分钟
Prometheus Metrics精简优化
Prometheus的TSDB Status里可以查看TOP10的指标:Top 10 series count by metric names,参考这个来优化指标吧!
筛选
推荐使用metric_relabel_configs
#保留
metric_relabel_configs:
- source_labels: [__name__]
regex: etcd_disk_backend_commit_duration_seconds_bucket|up
action: keep
#去除
metric_relabel_configs:
- source_labels: [__name__]
regex: nginx_filter_.*
action: drop
或者使用whitelist_regex或者blacklist_regex 举例:
# 只监控以http开头的指标
whitelist_regex: ^http.*
# 不监控以http开头的指标
blacklist_regex: ^http.*
合并
kube-apiserver的apiserver_request_duration_seconds_bucket指标数量太多尝试进行合并:
将0.1、0.2、0.5、1、2、5、10、30和+Inf的桶(bucket)合并为0.1的桶(bucket),将0.3、0.6、1.5、3、6、15、30、60、120、300、600、1800、3600和+Inf的桶(bucket)合并为0.3的桶(bucket),以此类推。
relabel_configs:
- source_labels: [le]
regex: "0\\.1|0\\.2|0\\.5|1|2|5|10|30|\\+Inf"
action: replace
target_label: le
replacement: "0.1"
- source_labels: [le]
regex: "0\\.3|0\\.6|1\\.5|3|6|15|30|60|120|300|600|1800|3600|\\+Inf"
action: replace
target_label: le
replacement: "0.3"
- source_labels: [le]
regex: "0\\.4|0\\.7|2\\.5|4|7|25|50|100|250|500|1000|1800|3600|\\+Inf"
action: replace
target_label: le
replacement: "0.4"
- source_labels: [le]
regex: "1\\.5|5|15|30|60|300|1800|3600|\\+Inf"
action: replace
target_label: le
replacement: "1.5"
Prometheus Metrics精简优化
https://blog.ikeno.top/posts/prometheus_metrics/