- 目标表(分区)数据量过大 / 分区过多:autoanalyze 分区表时,若单个分区数据量巨大(如数十亿行)或分区数量过多,分析操作会消耗大量 TiDB 节点 CPU / 内存,同时频繁与 PD 交互获取 Region 信息,超过 PD 的交互超时阈值(默认有内部超时限制),导致超时失败。
- PD 与 TiDB/TiKV 节点网络延迟 / 抖动:虚拟机部署环境可能存在虚拟网络带宽不足、网卡瓶颈或节点间网络抖动,autoanalyze 和查询操作对 PD 的高频请求在网络不佳时,容易触发超时(尤其是大表操作,交互次数更多)。
- 统计信息相关配置不合理:TiDB 的 autoanalyze 触发阈值、超时配置与当前集群资源不匹配,大表分析时无法在合理时间内完成,最终导致 PD 超时;同时,表的统计信息失效后,查询优化器生成的执行计划可能引发大量无效 PD 请求,加剧超时。
- 影响:autoanalyze 失败会导致表的统计信息陈旧 / 缺失,查询时 TiDB 优化器无法生成最优执行计划,可能引发全表扫描、大量 Region 遍历,进一步增加与 PD 的交互压力,最终查询也报 PD timeout。