接入 TiKV 集群,某节点 leader 频繁切换,日志持续输出 “leader transfer timeout”,version v6.6.1 如何处理?

新接入 TiKV v6.6.1 集群(3 节点部署 ),其中 1 个节点 leader 每隔 10 - 15 分钟就切换一次,日志里 “leader transfer timeout” 不断刷屏,检查服务器 CPU、内存、网络都未发现明显异常,该怎么定位是节点自身问题还是集群配置问题?

  • 6.6.0-DMR: 2023-02-20
    没看过 6.6.1 版本。

而且看描述是裸 kv 使用?

磁盘空间的使用情况是否有检查,这也是一个可能造成日志转移失败的原因,另外可以分析下PD的日志,看看有没有蛛丝马迹

1 个赞

可以看下监控存储是否到达了设置的瓶颈,或者是否有热点问题