tidb 使用的一块盘损坏了,怎么能恢复并且不影响数据

【TiDB 使用环境】生产环境
【TiDB 版本】v7.5.5
【操作系统】
【部署方式】物理机 nvme
【集群数据量】353G
【集群节点数】5
【问题复现路径】
【遇到的问题:问题现象及影响】部署tidb 集群的一块nvme 盘坏了,想用一块新盘进行替换,如何替换并且不影响数据,看文档只有缩容和有损恢复
【资源配置】*
【复制黏贴 ERROR 报错的日志】
【其他附件:截图/日志/监控】

1 个赞

拓扑结构发一下呢

1 个赞

坏了盘的物理机跑了什么tidb组件,有几个?

1 个赞

是的,可以用缩容,缩容不影响数据。

1 个赞

这是预生产的,生产环境的不能截图
生产环境只多了一个kv 和pd

确定不影响吗

5个节点,挂1个,不影响数据。

5个节点挂3个节点才需要做有损恢复。

这是有损恢复的场景。现在集群应该是正常运行的,如果数据丢失,集群应该查不到数据才对。

那现在恢复的话直接缩容就可以?
缩容后再进行扩容

是的,官方文档也有说明,一个节点挂了不会影响服务。

5个节点宕机一个是没问题的,同时宕机2个就不行了

1 个赞

ok,多谢

目前来看,缩容了有问题的组件,关机换硬盘再扩容就行

可以参考这个看看,感觉上是类似的

1、节点隔离

2、服务器停机下线

3、更换硬盘,重新启动服务

数据有副本,本来不影响的

坏一个可用区也不影响

我想问你做raid了没,5个tikv节点现在都正常吗?如果正常,直接把要换磁盘的节点stop了,机器shutdown,然后换了磁盘,然后启动机器就行了,都没必要缩容再扩容了