服务器CPU如何做好监控

lmdb · 2025 年12 月 3 日 06:20

【TiDB 使用环境】生产环境

生产环境的集群，经常收到CPU使用率的告警，超过了阈值70%。

如何做好cpu使用率的监控呢，需要分析告警时cpu的具体情况。

Kongdom · 2025 年12 月 3 日 06:20

我们一般是看dashboar的top sql来监控

lmdb · 2025 年12 月 3 日 06:21

建议使用Oracle的osw来做这个记录嘛

纯白镇的小智 · 2025 年12 月 3 日 06:23

TiDBer_ohQud1vx · 2025 年12 月 3 日 09:18

CPU 消耗涉及 **TiDB 节点（SQL 层）、TiKV 节点（存储层）、PD 节点（元数据管理），及底层操作系统，监控需覆盖 “节点 - 进程 - 语句 - 内核” 全链路

异乡的大人 · 2025 年12 月 3 日 12:42

这个要详细好多

异乡的大人 · 2025 年12 月 3 日 12:49

可以使用工具Prometheus+Grafana（官方推荐） + 系统级工具（top/pidstat/perf），监控数据需留存足够周期（建议≥7 天）用于追溯

异乡的大人 · 2025 年12 月 3 日 12:50

通过慢查询、审计日志、线程栈分析根因，针对性优化（如 SQL 调优、TiKV Compaction 配置、扩容等）

TiDBer_Ejh0eCXc · 2025 年12 月 3 日 22:58

crontab 里面top输出到文本

TiDBer_Ejh0eCXc · 2025 年12 月 3 日 22:59

输入时候要写时间戳,用date函数

TiDBer_Ejh0eCXc · 2025 年12 月 3 日 22:59

普罗米修斯?

yaabb163 · 2025 年12 月 4 日 00:53

用zabbix 或使用top命令

万仞听松 · 2025 年12 月 4 日 01:52

一般都有监控系统吧。再加上tidb自带的基本够用了

lmdb · 2025 年12 月 4 日 05:28

遇到的情况是节点CPU告警，想确认下具体是那个组件对CPU使用率较高，节点上部署了组件较多， pd、cdc、tidb等做的混合部署。

lllzd · 2025 年12 月 4 日 07:14

可以用Grafana + Prometheus来监控。

独善其身 · 2026 年1 月 13 日 02:25

使用Prometheus单独部署监控试试

a大力啊 · 2026 年1 月 13 日 06:51

可以使用工具Prometheus+Grafana（官方推荐） + 系统级工具（top/pidstat/perf），监控数据需留存足够周期（建议≥7 天）用于追溯，一般是这的，也有第三方或自己的监控平台

TiDBer_EMDRI6T4 · 2026 年1 月 19 日 09:08

Augenstern · 2026 年1 月 19 日 09:18

TiDBer_YPbNvXxe · 2026 年1 月 19 日 12:34

zabbix监控资源运行情况哦