TIDB集群，region含有较多peeding-peer,down-peer。求助如何解决

Kevin-Lu · 2026 年2 月 9 日 08:36

5个tidb节点: 20C64G
5个pd节点: 8C32G
22个tikv节点: 16C128G 3.2T nvme盘

TiDBer_Ejh0eCXc · 2026 年2 月 9 日 22:44

查看 Grafana → TiKV-details → Server → Raft Message Total Duration 和 Append Log Latency 。

另外,如果 IO 延迟过高，TiKV 无法及时响应 Raft Heartbeat，PD 会认为节点下线（Down Peer）

Kevin-Lu · 2026 年2 月 10 日 01:39

7.1.6的版本，没找到你说的2个监控项

db_user · 2026 年2 月 10 日 01:55

display下，看下所有tikv的状态，是不是执行过缩容操作

Kevin-Lu · 2026 年2 月 10 日 02:00

问题找到了，有2台tikv之间通信有问题，修复了一下，只剩几百了
准备升级版本至7.5.7 有无建议

独善其身 · 2026 年2 月 10 日 02:02

从提供的内容来看,看不出啥问题来,有报错日志信息吗

Kevin-Lu · 2026 年2 月 10 日 02:04

感谢，目前peending-peer、down-peer问题已经解决。但是版本较低，准备升级至7.5.7了

Kevin-Lu · 2026 年2 月 10 日 02:04

未进行过缩容，只做过2次扩容。

db_user · 2026 年2 月 10 日 02:31

ok,通信有问题那正常现象，目前使用7.5.4的版本比较稳定的,如果升级也可以考虑8.5，性能会更好

乾坤大挪移 · 2026 年2 月 10 日 03:12

如果 IO 延迟过高，TiKV 无法及时响应 Raft Heartbeat，PD 会认为节点下线

TiDBer_Ejh0eCXc · 2026 年2 月 10 日 13:45

对,这就是“心跳”的健康检查与容错机制

Kongdom · 2026 年2 月 10 日 14:29

独善其身 · 2026 年2 月 11 日 01:56

正好心跳和脑裂知识不大熟,看看有没有这方面的报错呢