请问告警tidb_tikvclient_backoff_seconds_count是什么问题?

请问tidb告警有这样的提示是什么问题?目前业务反馈很卡,和这个相关吗?

expr=“increase( tidb_tikvclient_backoff_seconds_count[10m] ) > 10”

CPU负载都挺高。延迟比以前高些。

https://docs.pingcap.com/zh/tidb/v6.5/alert-rules/#tidb_tikvclient_backoff_seconds_count
发生重试的次数,很卡有可能是重试次数多,具体还是需要看SQL慢在哪里。

1 个赞

是默认的阈值设置的太小的问题 :rofl: 你检查你 SQL 执行没问题就好

1 个赞

一般这个告警没啥影响,主要看其他指标

1 个赞

会产生backoff很正常,业务越忙,产生的概率,越高,你只要对比平常相同的业务时间段,没变多即可。

1 个赞

region leader频繁调度,tidb缓存的region信息过旧,就会产生backoff,从新去pd获取最新的region信息

该告警表示最近10分钟内,tidb和tikv之间的重试次数超过10次而报警了,可能的原因应该是tikv节点太忙了,导致频繁重试造成的,或者region分离或者合并造成region对应的leader信息从一个节点迁移到另一个节点,导致请求重试,因为读写数据都是leader节点操作