GC不触发回收

TiDBer_kGojpEk7 · 2025 年8 月 22 日 09:21

【TiDB 使用环境】生产环境
【TiDB 版本】V8.1.0
【操作系统】BCEuler-21.10
【部署方式】云上部署
【集群数据量】21
【集群节点数】13
【问题复现路径】
【遇到的问题：问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面

【复制黏贴 ERROR 报错的日志】
[2025/08/18 20:43:09.324 +08:00] [ERROR] [gc_worker.go:744] [“resolve locks returns an error”] [category=“gc worker”] [uuid=662377be638000a] [error="epoch_not_match:<> "]
【其他附件：截图/日志/监控】

xfworld · 2025 年8 月 23 日 05:15

手动跑 GC 命令试试

有猫万事足 · 2025 年8 月 23 日 13:33

这个错误一般来说不严重，如果是region正好在分裂或者合并都会有这个报错。仅从这个报错不能充分的证明gc被卡住了。

建议查一下grafana 上的 tikv-details->GC->TiKV auto GC safepoint，观察 gc safepoint 推进是否符合预期。这个才是决定性的gc卡住的证明。

Liucy · 2025 年8 月 24 日 01:05

可以参考下这个文档 TiDB server没有触发GC ？？？ - #14，来自 TiDBer_sheldon

TiDBer_HErMeXDz · 2025 年8 月 25 日 03:26

默认情况下GC 每10分钟执行一次。。检查一下日志

TiDBer_sheldon · 2025 年8 月 25 日 03:28

手动如何跑命令？有知道文档链接吗？我也遇到类似的

xfworld · 2025 年8 月 25 日 03:59

https://docs.pingcap.com/zh/tidb/stable/tikv-control/#手动-compact-整个-tikv-集群的数据
 https://docs.pingcap.com/zh/tidb/stable/garbage-collection-configuration/

参考下，这个不能替代正常的GC，可以手动合并 tikv 的数据版本

TiDBer_sheldon · 2025 年8 月 25 日 06:02

非常感谢风向，我试试

lllzd · 2025 年8 月 26 日 00:54

看日志报了一个TiDB集群在GC过程中出现的常见错误，虽然日志类型为error，但在某些场景下属于可恢复的临时性错误，不一定表示集群处于严重故障状态。

独善其身 · 2026 年2 月 9 日 04:30

我也建议手动看看能不能正常执行,报错信息看看

Augenstern · 2026 年2 月 9 日 08:32

GC 相关参数配置不合理：如 tikv_gc_life_time 设得过大、gc.enable 被误关闭、leader 节点异常导致 GC worker 未正常运行。
TiDB 集群元数据异常：统计信息损坏、表锁 / 事务锁未释放，导致 GC 无法遍历清理数据。
TiKV 存储层异常：RocksDB 压缩 / 清理线程阻塞、TiKV 节点磁盘 IO 过高，GC 任务被阻塞。
PD 调度异常：GC 的 safe point（安全点）计算依赖 PD，PD 节点异常会导致 safe point 无法更新。

Kongdom · 2026 年2 月 9 日 15:12

手动执行compact，运维常用操作

system · 2026 年2 月 16 日 15:13

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。