我是 SSIS 的新手,正在尝试使用它的并行功能从数据库中导入数据。
我的工作是做到这一点:尽快将一个多 TB 的数据库导入一组平面文件。
我在想这个:
我有一个 Microsoft Server 2008 HPC 集群(3 个节点)供我使用。我正在考虑编写一个 HPC SOA 作业,以便所有三个计算节点都可以独立连接到 SQL Server 并并行导入部分数据。当然,这与 SSIS 无关,是一个独立的实用程序。
然后我遇到了 SSIS,以及它的并行导入功能。我的 SSIS 服务器不是很高端——只有 4GB 的机器。我有点倾向于使用 SSIS,因为这是 Microsoft 进行数据导入的理想方式——而且我不必重写很多东西,也不必使用现有的转换等。
使用自定义任务(或可用任务)并并行导入的最佳方式是什么?