冲突数据,即两条或两条以上的记录存在 PK/UK 列数据重复的情况。当数据源中的记录存在冲突数据,将导致该表真实总行数和使用唯一索引查询的总行数不一致的情况。冲突数据检测支持以下策略:
remove:推荐方式。记录并删除所有的冲突记录,以确保目的 TiDB 中的数据状态保持一致。none:关闭冲突数据检测。该模式是两种模式中性能最佳的,但是可能会导致目的 TiDB 中出现数据不一致的情况。
使用 Physical Import Mode - v6.5 | TiDB 文档中心
在 v5.3 之前,TiDB Lightning 不具备冲突数据检测特性,若存在冲突数据将导致导入过程最后的 Checksum 环节失败。开启冲突检测特性的情况下,只要检测到冲突数据,TiDB Lightning 都会跳过最后的 Checksum 环节(因为必定失败)。
文档所示,这里冲突是dumpling导出时的问题还是在导入时的问题?源库的PK和UK不可能会有重复数据吧