SQL 语句get snapshot time 时间很长

从SQL 的执行计划来看,主要是是get snapshot time 时间拉长了,那么
根据官网的排查建议,我这边如何确定是raftstore慢还是去获取版本的时候慢呢


tikv_raftstore_request_wait_time_duration_secstikv_raftstore_commit_log_duration_seconds
这两个指标有监控图吗

TIKV上不能看到吗

  1. 首先 ,检查 Grafana 中 tikv_raftstore_request_wait_time_duration_secstikv_raftstore_commit_log_duration_seconds 的监控图。
  2. 如果 这两个指标很高,问题出在 Raftstore (排队或日志提交)。
  3. 如果 这两个指标正常,但 get snapshot time 依然很高,问题则很可能出在从 RocksDB 获取数据 的环节

有监控图,而且你问的这两个指标,在 Grafana TiKV-Details 面板里都能直接看到。

get snapshot 拉长 = 读请求在 TiKV 端排队 / 等待 / 获取最新版本(safe_ts/resolved_ts)变慢,可以通过 Storage 快照耗时 + Raft 相关指标 + Thread CPU 三步区分:是 Raftstore 忙 还是 获取版本(读一致性)慢。

  • Raftstore 慢:等待 Raft 状态、日志提交 / 同步、锁竞争 → 看 Raft 相关延迟、CPU、等待队列
  • 版本获取(Snapshot 构建)慢:Raft 本身不堵,但读取最新已提交版本、构造 MVCC 快照耗时 → 看 Storage Snapshot 耗时、 RocksDB 读取、GC 压力

在哪个监控面板

感谢老师分享

darshboard应该有这一部分监控显示吧