tidb-server oom

tidb实例挂掉瞬间恢复
tidb相关日志:

系统日志:


相关监控:


有几个tidb-sever节点?是不是开了什么功能,parallel cpu profiler Started
还有最后一行。是不是有慢SQL,SQL原因导致的用内存太多,全表扫描

看到你的监控图,内存突然飙升。。个人认为是 高并发的大SQL。。也有可能是BUG

出现问题的时间段,查看了sql 占用内存最大为1G ,而且设置了mem-quota ,感觉不像是sql 的问题导致的

我怀疑是内存泄漏,但是监控的那几个指标不是理解具体的含义

去dashborad面板里面看sql统计,在oom相关时间按内存占用和执行次数筛选下,看下有啥慢sql、dml;也可以留意下有没重量级的ddl执行,有时候也会导致内存飙高。

内存泄漏大部分是一直维持高水位,下降很少,持续一段时间一直缓缓上升,然后导致oom。

而你这个看图是瞬间跳高,然后直接被kill。这个一般来说不太可能是内存泄漏。还是应该从并发的角度来考虑。

建议查看一下连接相关的监控。

怀疑是当时的并发高导致的oom 吗?连接相关的监控具体的面板是哪个?监控值保留3天的,现在已经看不到当时的连接情况了

1 个赞

去对应 tidb server 节点,找下 deploy 下 log 目录下的 oom_record 目录里面的内容看一下。
https://docs.pingcap.com/zh/tidb/stable/configure-memory-usage/#tidb-server-内存占用过高时的报警

1 个赞

有大逻辑操作吗这是

对,应该是有大查询导致的。

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。