一个好的问题描述有利于社区小伙伴更快帮你定位到问题,高效解决你的问题
【TiDB 使用环境】生产环境
【TiDB 版本】6.5
【部署方式】
【操作系统/CPU 架构/芯片详情】
【机器部署详情】
【集群数据量】
【集群节点数】
【问题复现路径】
表的数据量有1500w, 现在用datax 运行sql做导入导出的. 发现性能非常低, 导入要差不多2个小时,导出要1个小时. 想问下有没有快速的导入导出文件的方法. 字段格式和分隔符要能自定义
一个好的问题描述有利于社区小伙伴更快帮你定位到问题,高效解决你的问题
【TiDB 使用环境】生产环境
【TiDB 版本】6.5
【部署方式】
【操作系统/CPU 架构/芯片详情】
【机器部署详情】
【集群数据量】
【集群节点数】
【问题复现路径】
表的数据量有1500w, 现在用datax 运行sql做导入导出的. 发现性能非常低, 导入要差不多2个小时,导出要1个小时. 想问下有没有快速的导入导出文件的方法. 字段格式和分隔符要能自定义
我记得好像有一种叫load工具,直接越过lsmtree机制进入合并的sst
6.5版本可以用import into 吗?
你说的是Bulk Load吗? 这种是直接已排序的 SSTable 文件. 普通的 一般不是先先写硬盘的 WAL,再写内存中的 MemTable,最后通过 Compaction 逐步刷盘。 这种的怎么实现?
是不是这样用ligntning ?
(1)先写一个配置表
[lightning]
status-addr = ‘:8289’
[tikv-importer]
backend = “local”
sorted-kv-dir = “/tmp/tidb/lightning/sorted-kv”
[mydumper]
data-source-dir = “/data/export”
read-block-size = “64KB”
[tidb]
host = “192.168.1.10” # TiDB IP
port = 4000
user = “root”
password = “your_password”
pd-addr = “192.168.1.20:2379”
(2). tiup tidb-lightning -config tidb-lightning.toml
导出: Dumpling
导入: TiDB Lightning
可以尝试一下
此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。