一个好的问题描述有利于社区小伙伴更快帮你定位到问题,高效解决你的问题
【TiDB 使用环境】生产环境
【TiDB 版本】6.5.1
【部署方式】云上部署(什么云)/机器部署
【操作系统/CPU 架构/芯片详情】
【机器部署详情】CPU大小/内存大小/磁盘大小
【集群数据量】
【集群节点数】
【问题复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【复制黏贴 ERROR 报错的日志】
【其他附件:截图/日志/监控】
1 个赞
对,确认 changefeed 状态 > 清理残留进程 > 清理 PD 元数据 > 处理监控缓存
2 个赞
这个问题的本质是 TiCDC 在删除 changefeed 时,没有彻底清理 PD 中的元数据和本地节点的状态文件,导致监控系统依然能采集到旧的指标。通过清理本地状态、重启服务和强制删除 PD 元数据,可以彻底解决这个问题。
1 个赞
请问清理本地状态、强制删除 PD 元数据具体怎么操作?
[tidb~]$ tiup ctl:v6.1.2 pd -u http://10.1*.5*.29:2379 service list
Starting component ctl: /home/tidb/.tiup/components/ctl/v6.1.2/ctl pd -u http://10.1
5*.2*9:2379 service list
{
“service_gc_safe_points”: [
{
“service_id”: “gc_worker”,
“expired_at”: 9223372036854775807,
“safe_point”: 463975945229828096
},
{
“service_id”: “ticdc”,
“expired_at”: 1770187066,
“safe_point”: 464021268380778514
}
],
“gc_safe_point”: 463975945229828096
}
原先有7个cdc同步,下线了3个cdc(先pause,后remove), 剩余4个cdc状态正常,旧的changefeed仍然有报警
Changefeed 未真正清理干净, 告警规则未适配清理逻辑 或PD 中残留 CDC 相关调度信息
感谢!tidb集群版本是v6.1.2, 按照你的办法创建同名任务,观察一会儿后直接删掉后,不报警了 。
独善其身
(Ti D Ber Bi Rqfz5 K)
13
怎么创建的同名任务,是将原来的任务删掉吗?还是有其他的替代方案呢
system
(system)
关闭
14
此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。