CPU profile 看着没什么问题
从目前已提供的信息,有一个疑点是 etcd 写延迟导致的。可以把 PD 的 etcd “99% Handle transactions duration” PromSQL 里的 0.99 改成 0.999999,然后与 TSO 的延迟对照,看是否相关
如果不是这里的原因,就只能在更大范围的数据里寻找线索了。建议提供 2~3 天的 PD 监控和日志,其中覆盖 2~3 次 TSO 延迟达到 10s 的情况。可以通过 clinic 采集,参考 https://pingkai.cn/tidbcommunity/forum/t/topic/272957