我的客户获取我需要插入数据库的 CSV 文件或固定宽度文件。
每次他们获得一个新文件时,除了新文件之外,它还包含所有历史记录。
我的问题是截断整个表并将它们全部重新插入还是尝试仅插入唯一的行更好?如果最好插入唯一的,这将如何有效地完成?
编辑:最大的 CSV 是 186,868 行,重复数据超过 99%。
我的客户获取我需要插入数据库的 CSV 文件或固定宽度文件。
每次他们获得一个新文件时,除了新文件之外,它还包含所有历史记录。
我的问题是截断整个表并将它们全部重新插入还是尝试仅插入唯一的行更好?如果最好插入唯一的,这将如何有效地完成?
编辑:最大的 CSV 是 186,868 行,重复数据超过 99%。