tikv单个节点cpu负载高,如何排查及优化

【 TiDB 使用环境】生产环境
【 TiDB 版本】v6.5.6
【遇到的问题:个别tikv cpu负载很高】
【附件:截图/日志/监控】


看了regions及leaders分布比较均匀,还有哪些排查的方法,请教大家一下

可以看看这篇帖子

1 个赞

先看tikv线程池中哪个线程池使用率高,大概率是unified read pool,如果是的话,去找TOPSQL,和扫key多的slowQuery。

可能是有数据热点吧,参考一下这个
https://docs.pingcap.com/zh/tidb/stable/troubleshoot-hot-spot-issues/

负载高,先看看是不是IO不行,CPU是否在处理大IO?

看 top sql

先看慢查询和 top sql

排查慢sql和top sql

看看是不是数据分布有热点

  • 开启 unified pool(合并线程池,减少上下文切换)
  • CPU 绑核server.configs.tikv.cpu
  • 合理设置:
  • rafstore.count
  • apply.count
  • coprocessor.count
  • SSD 必须高 IOPS,避免IO 等待反过来压 CPU

tikv日志里看看有没有有用的信息,然后就是负载,io,慢查询,top sql了

盲猜是热点数据导致的。

第一个tikv的热点region太多了吧

优先排查一下慢查询看看