弹性扩容:TiDB 在线扩容节点,业务侧需要做哪些配合工作?

TiDB 支持在线扩容,扩容前后有没有需要规避的风险?扩容后数据均衡阶段会影响业务吗?

一、扩容前、扩容中需规避的风险

  1. 业务负载风险 避开业务高峰期执行扩容。扩容伴随 Region 迁移、Raft 日志同步,会占用 TiKV 网络、磁盘 IO、CPU 资源,高峰叠加易导致读写延迟升高、超时。

  2. 集群状态校验风险 扩容前务必检查集群健康度:确保无 down/offline 节点、无大量 pending Region、Raft 副本全正常、不存在锁等待 / 长事务。集群本身异常时扩容,会加剧故障,甚至引发数据同步异常。

  3. 版本与配置一致性风险 新增 TiKV 节点版本必须和现有集群完全一致;同时保证参数、系统内核、磁盘挂载策略、内存配置统一,避免因配置差异导致节点性能不均、均衡卡住。

  4. 资源预留风险 提前检查目标服务器磁盘、内存、网络带宽,防止节点资源不足,上线后直接成为短板节点。

  5. DDL 与大任务规避 扩容期间停止执行大批量 DDL、全量备份、Lightning 导入、大批量数据变更等重任务,多任务抢占资源会拖慢数据均衡,影响业务。

这个功能是支持的。建议先看下官方文档的对应章节,如果遇到具体问题可以贴出来,我帮你分析。

定时停止系统就可以吧