TiDB 启动时报 PD connection refused,集群完全无法访问故障

运维重启全部 TiDB 服务后,所有客户端都无法连接数据库,TiDB 服务日志持续打印连接 PD 拒绝的报错,三台 PD 进程均正常运行、端口监听正常,服务器之间内网网络互通无防火墙拦截。

PD 进程起来但没选出 Leader(最高概率),端口通但不受理请求
TiDB 的 PD 连接地址格式写错、域名解析失败
PD 只监听 127.0.0.1,不对外提供访问
两端 TLS 证书配置不一致握手失败

贴一下具体报错信息或日志方便大家定位。

PD 未选出 Leader、监听仅本地回环、连接地址错误、TLS 证书不匹配

贴报错堆栈,结构化信息能定位代码层问题。

检查 PD 集群状态、成员配置及 TiDB 节点 PD 地址配置,核对集群 ID 是否一致,重启 PD 或重新同步集群元数据

PD 集群未正常选主、集群 ID 不一致或 TiDB 配置 PD 地址异常,导致 TiDB 无法正常连接 PD,客户端随之断连。

优先检查PD是否成功选出Leader,核对TiDB的PD连接地址、集群ID及监听配置。

TiDB 集群的集群 ID 是由 PD Server 在初始化时随机分配的。如果您在清空数据后重新部署或重启了 PD Server,集群 ID 可能会发生变化。此时,如果仅重启了 PD 和 TiKV 而未重启 TiDB Server,TiDB 会因持有旧的集群 ID 而拒绝连接 PD