1

我们正在考虑从合作伙伴的 Microsoft SQL Server 收集数据并将其导入我们自己的 SQL Server。我们想要做的一部分是将他们的所有数据分开,然后将它们组合在一起,这样我们就可以创建关于它们相对于彼此的表现的基线。我很想知道有哪些最佳实践或建议可以实现这一目标?

我能想到的最简单的方法是将它们设置为我们的 SQL Server 上的链接服务器,然后编写存储过程(并使用 SQL Server 代理自动执行计划)以将数据从每个表导入本地表。我也开始研究第三方系统来执行此操作(例如stitchdata),但没有看到将数据导入本地的系统,其中大多数似乎将数据导入云数据库解决方案。

以前有没有人做过类似的事情并且可以帮助引导我们朝着正确的方向前进?

谢谢!

4

1 回答 1

0

要使用 SQL 工具解决此问题,一种方法是创建一个临时数据库来加载所有外部信息。

要收集数据,您可以使用 SSIS 包直接连接到源。并在 SQL ServerAgent 上安排包

由于许多原因,我避免使用链接服务器来提出 ETL 建议,但对我来说最重要的是:

  • 如果远程服务器不可用,则所有 ETL 过程都可能中断。
  • 该过程将与起源密切相关,如果源发生变化,您将需要重建许多东西。

Tou 可以使用或不使用 SP 来加载和比较最终数据库和阶段之间的表。这将取决于数据库是否在同一台服务器上、性能等。

于 2017-09-20T13:13:20.143 回答