【TiDBer 唠嗑茶话会 180】TiDB 可观测性调研:关于 Top SQL 内存占用和指标需求,来分享你的监控经验吧!

默认设置
IO

  1. TopSQL 的数据保存期限大家一般会设置多久?
    两周。
  2. 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    频繁sql、锁、内存
  3. 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    暂无

1、TopSQL 的数据保存期限大家一般会设置多久?
最好是7天
2、除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
执行计划是否变化
3、有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
SQL与等待事件的对应关系,在数据库异常繁忙的时候需要有个指标可以定位到根因SQL。

  1. TopSQL 的数据保存期限大家一般会设置多久?
    之前设置的15天
  2. 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    sql的平均io相关
  3. 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    暂无
  1. TopSQL 的数据保存期限大家一般会设置多久?
    两周左右
  2. 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    执行时间、内存
  3. 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    暂无
  1. TopSQL 的数据保存期限大家一般会设置多久?
    一个月
  2. 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    执行次数、响应时间以及io
  3. 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    暂无
TopSQL 的数据保存期限大家一般会设置多久?
2个月左右
除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
相应时间,慢查询
有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
没有

正常7天了,长期可以30天,top CPU,top io,还要慢sql

向大佬们学习

TopSQL 的数据保存期限大家一般会设置多久?
默认设置,没有修改
除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?

有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
一直想TIDB出版本升级后可以回退的功能。

  • TopSQL 的数据保存期限大家一般会设置多久?
    30天够了,近期的看出问题时的排查,1-7,7-30看近期的平均值,再多就没用了。
  • 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    锁,执行计划。
  • 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    还没大用过TiDB,web界面配置监控、备份还原应该挺方便的。
  1. TopSQL 的数据保存期限大家一般会设置多久?
    默认值。
  2. 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    查询内存消耗情况
  3. 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    只有tidb、tikv 耗时,没有tiflash耗时情况。能否增加tiflash选择
  1. TopSQL 的数据保存期限大家一般会设置多久?
    默认值。
  2. 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    事务锁
  3. 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    执行计划突变导致的性能波动

默认是7天

  1. TopSQL 的数据保存期限大家一般会设置多久?
    默认值
  2. 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    内存、锁
  3. 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    暂未关注
  • TopSQL 的数据保存期限大家一般会设置多久?
    半个月左右
  • 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    SQL 锁问题
  • 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    向量数据优化,oracle 有这方面
  1. TopSQL 的数据保存期限大家一般会设置多久?
    默认的,没单独设置过
  2. 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    慢sql、耗时、同一类sql的在不同时间的耗时变化
  3. 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    ASH,这个对于排查问题很有用。有个类似阿里云RDS AAS功能也很好
    同一类sql的在不同时间的耗时变化。
  1. TopSQL 的数据保存期限大家一般会设置多久?
    默认的就可以了

  2. 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    内存指标也是需要的,可以看到节点的内存使用情况

  3. 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    目前的指标够多了,大部分都在grafana中,dashborad 中差不多够用了

  • TopSQL 的数据保存期限大家一般会设置多久?
    1天,必须马上解决
  • 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    执行次数,IO占用
  • 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的
    很全了,基本都有了
  • TopSQL 的数据保存期限大家一般会设置多久?
    一般设置一个月左右差不多了吧。
  • 除了现有的 cpu 指标,大家觉得哪些指标比较有必要体现在 Top SQL 里,在定位问题/监控时,大家需要看哪些常用指标?
    SQL 锁问题
  • 有没有一些在其他数据库看到的比较有价值/有帮助的指标,在 TiDB 里没有的(也可以分享下,我们多多进行优化改进!)
    向量数据优化,oracle 有这方面