cdc checkpoint延迟 tso未推进

pause-resume后 任务就恢复了

711 版本啊。推荐升级!!! * 7.1.6: 2024-11-21

目前已经在评估升级到7.1.6版本了 因为测试环境7.1.1没有问题,无法观察 目前不确定问题集群升级后能否解决这2个问题

1 个赞

可能环境不一样,但是个人推荐升级试试。本身 711 版本比较老了,第三位拉高点没坏处。

1 个赞

TiCDC 假死

1 个赞

v7.1.1,为什么不升级版本试一下?

1 个赞

根因(官方确认)

TiCDC v7.1.1 存在严重 Bug: Kafka 元数据刷新失败(broken pipe / 连接断开)后,内部 sink 模块死锁 / 卡住,导致:

  • 数据不再往下游 Kafka 写
  • sink flush rows 不动
  • checkpoint 无法推进
  • resolved ts 正常(因为 puller 正常)

这是 v7.1.1 官方典型已知问题。

1 个赞

延迟有可能跟网络有关

学会了

增加并行复制任务:增加 worker-count可以加速数据复制

该现状和性能无关

在 changefeed 配置中添加 强制心跳 + 调整 checkpoint 推进参数