我没有太多的 ETL 经验,但我也没有找到我的问题的答案,尽管我想如果你已经使用它可能是不费吹灰之力的。我们目前正在研究创建一个简单的数据仓库(就像“从大多数表中复制大多数列”而不是 OLAP 样式一样简单),而且出于几个原因,我们似乎倾向于 SQL Server (2008)。
当涉及到 SQL Server 时,SSIS 似乎是此类任务的工具,但我找不到任何关于它如何影响源数据库缓存的信息,如果有的话,在加载数据时。当涉及到使用风格的缓存时,我们的一些安装在性能方面非常敏感。
但是如果 SSIS 运行“select *”-ish 查询并且缓存被更改,那么用户的性能可能会降低到不可接受的水平,直到它再次从这些查询中重建。
所以我的问题是,从 SQL Server 数据库加载数据时,SSIS(或有没有办法避免)会影响数据库缓存吗?
部分问题还在于源数据库可能是 Oracle 或 SQL Server 数据库,因此如果有办法避免 Oracle 的缓存影响部分,那也是很好的输入。(我猜 Attunity 连接器是要走的路?)
(一些附加信息:我们也考虑过普通文件,但是导出导入可能比 SSIS 传输花费更长的时间?我还猜想更改数据捕获是我们也会研究的内容,所以如果这与这个问题有关,请随意包括可能的问题/好处。)
也欢迎任何其他相关建议!
谢谢!