TiDB 支持在线扩容,扩容前后有没有需要规避的风险?扩容后数据均衡阶段会影响业务吗?
一、扩容前、扩容中需规避的风险
-
业务负载风险 避开业务高峰期执行扩容。扩容伴随 Region 迁移、Raft 日志同步,会占用 TiKV 网络、磁盘 IO、CPU 资源,高峰叠加易导致读写延迟升高、超时。
-
集群状态校验风险 扩容前务必检查集群健康度:确保无
down/offline节点、无大量 pending Region、Raft 副本全正常、不存在锁等待 / 长事务。集群本身异常时扩容,会加剧故障,甚至引发数据同步异常。 -
版本与配置一致性风险 新增 TiKV 节点版本必须和现有集群完全一致;同时保证参数、系统内核、磁盘挂载策略、内存配置统一,避免因配置差异导致节点性能不均、均衡卡住。
-
资源预留风险 提前检查目标服务器磁盘、内存、网络带宽,防止节点资源不足,上线后直接成为短板节点。
-
DDL 与大任务规避 扩容期间停止执行大批量 DDL、全量备份、Lightning 导入、大批量数据变更等重任务,多任务抢占资源会拖慢数据均衡,影响业务。
这个功能是支持的。建议先看下官方文档的对应章节,如果遇到具体问题可以贴出来,我帮你分析。
定时停止系统就可以吧