我的TiKV 节点的 CPU 和 IO 都不高，但整体 TPS 上不去，大佬们可能瓶颈在哪里呀。

元神启动 · 2026 年6 月 10 日 13:02

TiDBer_DiE2Mh1s · 2026 年6 月 10 日 13:03

一、首先看：是不是有“慢SQL”在拖后腿？

这是最常见的原因。一个没走索引的全表扫描，就能把集群的 readpool 线程池打满，拖累所有查询。

快速验证 ：

典型案例：一张150万行的表，查询条件是 where dataid = ? ，但 dataid 字段没加索引，应用还在循环调用，最终把整个集群拖垮。

解法：explain 看执行计划 → 缺索引就加索引 → 优化后对比监控指标

即使 CPU、IO 都不高，热点也能让性能卡在单点——你看到的可能是整体平均值，但某个 TiKV 节点或某个 Region 已经跑满了。

快速验证 ：

典型场景：自增主键 导致所有写入集中在一个 Region，单节点 CPU 打满但其他节点空闲。

解法：

RocksDB 的 Compaction 或 Write Stall 会在后台悄悄消耗资源，监控上不一定能看到明显异常。

快速验证 ：

解法：