【TiDB 使用环境】测试环境
【TiDB 版本】
【部署方式】机器部署
【操作系统/CPU 架构/芯片详情】
【机器部署详情】
【集群数据量】
【集群节点数】3个节点,每个节点部署1个PD和1个TiKV
【问题复现路径】
【遇到的问题:问题现象及影响】
3个节点,如果其中1个或2个节点关机(正常关机,不考虑异常断电造成数据损坏的情况), 重新开机后,集群能自动恢复正常吗?需要手动干预吗?
PD和TiKV在这方面的处理策略是一致的吗?还是有所不同?
【资源配置】
【复制黏贴 ERROR 报错的日志】
【其他附件:截图/日志/监控】
克里克里克
(Ti D Ber H052ej9m)
2
关1个没事,不影响运行。短期内开机没有影响。关两个多余半数了,集群运行不了。
菩提老祖
(菩提老祖)
3
关机 1 节点:完全自动恢复,业务影响极小。
关机 2 节点:集群不可用,但重启后自动恢复,无数据风险。
PD 与 TiKV:底层 Raft 一致,但架构与故障域完全不同;PD 是单点 Raft、TiKV 是分布式多 Raft。
生产建议:避免同时关闭 2 个节点;如需维护,一次只停 1 个节点,并等待恢复后再操作下一个。
Royce1220
(Ti D Ber Kwxb3 N7 I)
5
分布式就是为了解决这种问题的,只要多数派存活就没事
tidb高可用哦, 只要满足多数派(Quorum) 原则就行
raft协议大多数能满足就可以正常运行。关机一个的话,时间久了就会迁移region。关机2节点,集群应该宕机,起到那个后应该正常恢复运行