怎么在有限的内存下，保证高并发请求

return_sl · 2020 年12 月 1 日 02:19

为提高效率，提问时请提供以下信息，问题描述清晰可优先响应。

【TiDB 版本】：5.7.25-TiDB-v3.0.13
我们生产tidb配置如下：
实例个数配置
TIDB 2台 32G/8核
PD 3台 8G/4核（其中两台分布在TIDB2个节点中）
TIKV 3台 32G/8核
【问题描述】：怎么在有限的内存下，保证高并发请求？
本公司TIDB应用背景：现在tidb在我们业务中主要担任的角色有
①报表查询、导出功能（占比40%）
②聚合查询业务（提供多表关联复查sql查询，平均每个sql有10个表关联，占比30%）
③其他业务库通过dts（实体同步工具）往tidb同步数据（占比30%）

如上图所示：今天早上，有一个报表分页导出功能，按照3万一次，总共20多万数据。执行次数在7次左右，每一次运行4个G内存（sql已经是优化过的，由于关联表多业务复杂没有太多优化空间），时间跨度为12分钟。然后tidb在8点50就出现了宕机。

然后我们查询了下我们gc的设置：发现tikv_gc_life_time 为51m50s

疑问如下：
1、是我们gc时间设置的太长的原因吗？如果我们tikv_gc_life_time调整为10m会进行及时回收资源吗？能避免上面的问题出现吗？
2、如果我们把gc调整为10m，当10分钟内出现大量的耗内存的sql是不是依然内存溢出导致宕机。这种情况下改怎么去优化呢？

辛苦提供下帮助。谢谢

QBin · 2020 年12 月 1 日 02:25

TiDB 的 gc 主要是用来清理 MVCC 的旧的版本数据的。具体可以参考文档。https://docs.pingcap.com/zh/tidb/stable/garbage-collection-overview#gc-机制简介
如果遇到内存引起的 oom 可以参考以下文档先进行排查：
https://docs.pingcap.com/zh/tidb/stable/tidb-troubleshooting-map#32-oom-问题
如果这边有聚合和比较重的查询的话建议可以尝试一下 4.0 的版本的 Tiflash 列式引擎：
https://docs.pingcap.com/zh/tidb/stable/tiflash-overview#tiflash-简介

return_sl · 2020 年12 月 1 日 02:38

TiDB 的 gc 主要是用来清理 MVCC 的旧的版本数据的。
那请问，像上面我执行的7次，每次占用4个G内存的sql，每个sql释放内存的时间是什么时候？什么条件才会触发内存回收。

yilong · 2020 年12 月 1 日 07:15

如果 sql 执行完成，那么有一部分内存是可以被新的session复用的，这部分是 go 自动决定多久回收的。