请问tidb告警有这样的提示是什么问题?目前业务反馈很卡,和这个相关吗?
expr=“increase( tidb_tikvclient_backoff_seconds_count[10m] ) > 10”
CPU负载都挺高。延迟比以前高些。
请问tidb告警有这样的提示是什么问题?目前业务反馈很卡,和这个相关吗?
expr=“increase( tidb_tikvclient_backoff_seconds_count[10m] ) > 10”
CPU负载都挺高。延迟比以前高些。
https://docs.pingcap.com/zh/tidb/v6.5/alert-rules/#tidb_tikvclient_backoff_seconds_count
发生重试的次数,很卡有可能是重试次数多,具体还是需要看SQL慢在哪里。
是默认的阈值设置的太小的问题
你检查你 SQL 执行没问题就好
一般这个告警没啥影响,主要看其他指标
会产生backoff很正常,业务越忙,产生的概率,越高,你只要对比平常相同的业务时间段,没变多即可。
region leader频繁调度,tidb缓存的region信息过旧,就会产生backoff,从新去pd获取最新的region信息
该告警表示最近10分钟内,tidb和tikv之间的重试次数超过10次而报警了,可能的原因应该是tikv节点太忙了,导致频繁重试造成的,或者region分离或者合并造成region对应的leader信息从一个节点迁移到另一个节点,导致请求重试,因为读写数据都是leader节点操作