【 TiDB 使用环境】生产环境
【 TiDB 版本】V7.5.3
【复现路径】
【遇到的问题:问题现象及影响】
TiCDC任务卡住,tso、checkpoint不动,状态是normal,error是null,暂停、继续任务不能恢复,重启cdc日志里报错最多的TiKV节点后恢复
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】
接收region报错,其他地方没有啥报错啊
看着像Region Leader 异常
估计又是bug导致的
有什么方法能查到是卡到哪里了吗,或者卡住的时间是哪些表的数据变更比较多
你这处理方法不是已经查到卡在哪里了么。
下次遇到就还用这种方法吧:查看日志,异常多的 tikv 节点,重启下。
推荐可以考虑升级到 7.5.7 看看稳定性是否有提升。
大佬,没有查到根本原因,不知道为什么,现在是每次都得重启tikv
对啊 所以让你试试升级到 757 可能解决。看起来是遇到 bug 了。
可能源于 TiKV 区域(region)不可用、拉取变更日志阻塞,或 TiCDC 与特定 TiKV 节点的 gRPC 连接异常,而非任务本身报错。



