请教社区大佬如何定位慢查询问题

TiDBer_Dzg0YKrl · 2025 年12 月 12 日 07:14

【TiDB 使用环境】生产环境
【TiDB 版本】v7.5.0
【操作系统】centos
【部署方式】3台机器部署（64核128G）
【集群数据量】
【集群节点数】3
【问题复现路径】tiup部署
【遇到的问题：问题现象及影响】慢查询过多，这种情况是该优化db、pd、kv的参数设置还是增加物理机内存？
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面

【复制黏贴 ERROR 报错的日志】性能诊断各项数据异常

【其他附件：截图/日志/监控】
服务器情况如图

春风十里不如你 · 2025 年12 月 12 日 08:40

analyze是系统sql，一般不会影响整个集群性能，无需过于关注，除了analyze之外有没有其他业务sql慢的

随缘天空 · 2025 年12 月 12 日 09:26

analyze语法不是业务sql，所以可不用太关注。此外，你得tidb和tikv是混合部署的，同一台服务器上两个组件都有，容易相互抢资源

异乡的大人 · 2025 年12 月 12 日 09:29

内存占用高，cpu使用率高，负载均衡也有些失衡

异乡的大人 · 2025 年12 月 12 日 09:31

10.227.159.234 节点磁盘使用率 85.2%、内存使用率 93.7%（均超 70% 阈值）；236 节点 Swap 内存占用过高

万仞听松 · 2025 年12 月 12 日 13:37

优化sql

万仞听松 · 2025 年12 月 12 日 13:38

优化参数

TiDBer_Ejh0eCXc · 2025 年12 月 12 日 23:15

资源利用率5分钟内不能超过80%. tidb distsql scan concurrency , tidb executor concurrency 这些可以试下减少

TiDBer_00001 · 2025 年12 月 13 日 01:45

先排查非 ANALYZE 的业务慢 SQL，同时优化节点内存 / 磁盘负载与 TiKV 集群均衡性

TiDBer_YPbNvXxe · 2025 年12 月 14 日 09:20

看你这种情况相互抢资源呢，tidb和tikv混合部署

TiDBer_Ejh0eCXc · 2025 年12 月 14 日 22:57

analyze table本来就是慢, 这个没关系的把

TiDBer_Dzg0YKrl · 2025 年12 月 15 日 03:14

三个节点的leader和region监控上看着都保持一样，均衡应该没有啥问题吧

TiDBer_Dzg0YKrl · 2025 年12 月 15 日 03:21

select * from某些很简单的表的时候都会由timeout的情况，网络之前有丢包，现在解决了，但是还是由超时的情况，在硬件内存占用如此高的情况下，是否也导致超时？

WalterWj · 2025 年12 月 18 日 09:00

我理解你是两个问题：

资源如果做隔离，cpu 内存等使用较高如何控制。
analyze 慢是否预期。

2 的话是预期的，和数据量有关。并且默认并发是 1 的跑。

1 的话可以参考混合部署相关文档：https://docs.pingcap.com/zh/tidb/stable/hybrid-deployment-topology/
或者使用 cgroup 隔离：https://docs.pingcap.com/zh/tidb/stable/tiup-cluster-topology-reference/#tikv_servers
关键字：resource_control

TiDBer_YPbNvXxe · 2025 年12 月 23 日 06:01

在互相请资源了吧

TiDBer_EMDRI6T4 · 2026 年1 月 1 日 08:37

一切的根源都是表扫描或高频SQL引起的资源占用，先从SQL计划入手分析

TiDBer_YPbNvXxe · 2026 年1 月 2 日 14:44

捕获慢 SQL → 分析执行计划 → 定位瓶颈 → 优化验证

TiDBer_dG625YmL · 2026 年1 月 2 日 16:17

需要排除掉峰值期间整体慢而引发的误报问题，找到出现性能问题时最初的SQL进行分析

独善其身 · 2026 年1 月 3 日 02:16

索引方面是不是没有建好

Royce1220 · 2026 年2 月 4 日 08:12

是不是表上main数据比较多，导致收集统计信息过慢