在规模的一端,您有一个“批量加载”的数据仓库,这意味着运行作业以加载数据。您可以利用这种专门的处理时间对数据进行建模并将其转换为易于分析的模式。数据仓库不仅仅是复制数据。
在规模的另一端是您现在正在做的事情 - 执行“联合”查询。
您需要研究每种方法的优缺点,并将它们与您的业务需求进行比较。您还需要考虑系统的未来状态,即您的程序可能现在可以工作,但是如果数据量增加或您突然需要访问另外五个系统会发生什么?
例如,如果您的用户拥有过期一天的数据(延迟),是否可以?这在5年后还会好吗?
在回答您的问题时:
1)您是否将做出决策所需的所有数据复制到数据仓库中?
如果您的用户可以忍受延迟,并且您有足够的磁盘空间和足够智能的复制(即 CDC),并且源系统的临时查询是一个问题,那么是的,您将复制所有数据。(变成通常称为 ODS 的东西)
2)您使用什么作为用户界面?
既然您已经提到了 SSIS(一个 MS 工具),请注意 MS 还附带 SSAS(一个多维数据集构建工具)、SSRS(一个 Web 报告工具)和 Excel(基本上是您的多维数据集客户端)。您可以将其包装在 Sharepoint 中,但这并非易事。
请注意,所有这些功能(ETL、Cubing、用户界面)也由许多其他供应商提供,但是在 MS 商店中,您基本上已经购买了 BI 工具,因此您可能希望从这些工具开始。
您可以使用 .Net 为自己构建一个更复杂的工具,但最好还是从现成的东西中获取。