提问:基于 Dumpling 做多租户导出平台,大家觉得最大风险点在哪?

自研了一套多租户 TiDB 导出平台,基于 Dumpling、Redis 异步队列、S3 存储、双重认证。

想调研下社区大佬:

  1. Dumpling 批量任务并发调度,生产最大风险是什么?
  2. 多租户场景下,导出任务如何严格隔离资源、防止集群雪崩?
  3. 针对 TB 级大表导出,有没有更稳、更快的优化方案?

求交流、求踩坑经验!

2 个赞

Dumpling 并发易抢占集群资源,多租户需做好资源隔离,大表导出还需针对性优化提速稳运行。

1 个赞

重点关注导出任务并发带来的资源争抢,做好租户隔离,并优化大表导出方案。

1 个赞

我踩过比较深的坑是大批量 delete 不拆分会卡住 GC,导致 TiKV 磁盘空间一直涨。后来把 delete 拆成每批 5000 行,配合 sleep 间隔就好了。还有 DDL 操作尽量在低峰期做,加索引会用 INGEST 模式。

我踩过比较深的坑是大批量 delete 不拆分会卡住 GC,导致 TiKV 磁盘空间一直涨。后来把 delete 拆成每批 5000 行,配合 sleep 间隔就好了。还有 DDL 操作尽量在低峰期做,加索引会用 INGEST 模式。

多租户导出,首先想到的就是对网络IO和磁盘IO的影响

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。