TiKV节点region分布不均

【TiDB 使用环境】生产环境
【TiDB 版本】5.2.4
【部署方式】机器部署
【操作系统/CPU 架构/芯片详情】Ubuntu
【遇到的问题:问题现象及影响】
集群详情如下



机房4个tikv挂载点的几块固态硬盘异常,将该4个tikv强制force下线,正常tikv执行unsafe-recover remove-fail-stores -s,对于region3peer全丢失的region,将该类region重建为空region,集群正常启动,后续扩容四个tikv节点,但是新的tikv节点与之前tikv节点存在region分布不均的问题,扩容至今已经20多天。

1、系统视图查看 region分布
SELECT t1.store_id,
sum(case when t1.is_leader = 1 then 1 else 0 end) leader_cnt,
count(t1.peer_id) region_cnt
FROM information_schema.tikv_region_peers t1
GROUP BY t1.store_id;


2、查看调度配置正常

3、查看region score,新上线的store的score都比其他的store低

4、其他tikv中db存储如下,不是log占用空间大

5、一周内调度详情选下


这几个 tikv 的硬件条件一样吗?

配置差不多 tikv几台服务器是固定的 扩缩容都是在这几台服务器上操作 之前tikv节点region是均衡的


这个扩容后的截图? 缺失大量region副本

从系统表查询的结果看,各个 store 上的 leader 数量是差不多的,但 region 数量差异较大
store region count/size 差异大吗

是不是哪个参数配置的有问题

tolerant-size-ratio,你这个参数设置为0,自动调整,是不是会导致数据不搬迁。


你看官方文档里面的这句话
文档位置

偏离度不是太大


初步推测集群还是有问题,监控上能看到 down peer。

是不是平衡的参数关闭了吧

应该是参数配置

版本这么低,为什么升级一下?