我正在尝试将数据插入数据库,但首先我使用查找检查每一行是否存在,类似于此处建议的方法: 如何防止 SSIS 从数据库中已存在的文件中导入数据?
SELECT DISTINCT VALUES // OleDb Source
|
LOOKUP // If exists
| // No Match Output
OLE DB DESTINATION // Insert new records
我正在使用RetainSameConnection=True
在我的工作流程中启用事务。使用大约 10,000 行的默认缓冲区,当行传递到 OLE DB 目标时,目标INSERT
将使用查找锁定SELECT
。
我试过SET READ_COMMITTED_SNAPSHOT ON
了,这会起作用,但是现在查找期间的性能非常慢,我认为这是由于 RetainSameConnection 属性,我无法判断 SSIS 甚至使用了 READ COMMITTED SNAPSHOT 隔离级别。我考虑过忽略目标上的失败,但我读到它会导致批量插入完全失败,而不是逐行失败。我也考虑过在所有读取上使用 NOLOCK,但它会将我所有的查找变成 SQL 查询。
源数据库可能读取数百万行。有没有更好的方法来实现这一点?