【TiDB 使用环境】生产环境
生产环境的集群,经常收到CPU使用率的告警,超过了阈值70%。
如何做好cpu使用率的监控呢,需要分析告警时cpu的具体情况。
【TiDB 使用环境】生产环境
生产环境的集群,经常收到CPU使用率的告警,超过了阈值70%。
如何做好cpu使用率的监控呢,需要分析告警时cpu的具体情况。
我们一般是看dashboar的top sql来监控
建议使用Oracle的osw来做这个记录嘛
tidb-ctl session查看会话 CPU);tikv-ctl thread list);CPU 消耗涉及 **TiDB 节点(SQL 层)、TiKV 节点(存储层)、PD 节点(元数据管理),及底层操作系统,监控需覆盖 “节点 - 进程 - 语句 - 内核” 全链路
这个要详细好多
可以使用工具Prometheus+Grafana(官方推荐) + 系统级工具(top/pidstat/perf),监控数据需留存足够周期(建议≥7 天)用于追溯
通过慢查询、审计日志、线程栈分析根因,针对性优化(如 SQL 调优、TiKV Compaction 配置、扩容等)
crontab 里面top输出到文本
输入时候要写时间戳,用date函数
普罗米修斯?
用zabbix 或使用top命令
一般都有监控系统吧。再加上tidb自带的基本够用了
遇到的情况是节点CPU告警,想确认下具体是那个组件对CPU使用率较高, 节点上部署了组件较多, pd、cdc、tidb等做的混合部署。
可以用Grafana + Prometheus来监控。
使用Prometheus单独部署监控试试
可以使用工具Prometheus+Grafana(官方推荐) + 系统级工具(top/pidstat/perf),监控数据需留存足够周期(建议≥7 天)用于追溯,一般是这的,也有第三方或自己的监控平台
zabbix监控资源运行情况哦