tikv异常重启问题

升级吧,遇到bug了

1 个赞

该问题是 TiDB v7.5.5 的已知 CDC Bug,短期可通过调整 CDC 任务缓解,长期必须通过升级版本根治。

1 个赞

通过 TiDB Dashboard 的 “CDC 监控” 页面,关注 CDC 任务延迟Region 处理失败数 等指标,提前发现潜在问题。

1 个赞

可能触发了bug
tikv#16023
“Panic in cdc::delegate::Delegate::sink_txn_put when resolved_ts < commit_ts”

  • Fixed in : v7.5.6 / v7.6.0+

虽然你日志中是 commit_ts < resolved_ts (看起来合法),但在某些边界条件下(如事务回滚、GC 干扰、resolved-ts 推进过快),CDC 模块仍可能触发断言失败。

此外,还有类似问题:

这些都在 v7.5.6+ 中修复。

  • 定位 CDC 日志文件:找到 TiDB 部署目录下的logs/cdc文件夹,查看cdc.log(核心运行日志),重点看重启时间点前后的日志片段
  • 提取 panic 详情:日志中会包含崩溃时的错误栈(如之前截图中的core::panicking::panic),可定位触发 panic 的具体代码逻辑或任务;
  • 补充系统层排查:查看操作系统dmesg日志(是否因 OOM 被内核杀死),或 TiDB 监控(通过 TiDB Dashboard 看 CDC 任务负载、资源占用波动)。

这个是bug吗? 看来已经解决的

关于tikv问题的排查步骤:1.检查配置参数 2.测试相关功能 3.尝试修复操作。 具体实施时还需要根据实际情况调整。