0

客观的 :

让我们考虑一个大型企业,我们拥有异构数据存储,例如 SQL 服务器、No-SQL 存储、ADL、ADF 等大数据存储,分布在不同的业务组中。

我们的目标是在企业级别构建沿袭服务,这将提供有关企业内不同数据存储实例之间的数据沿袭的见解。这将有助于我们深入了解企业内的数据扩散。

为此,作为第 1 阶段,我们希望采用 SQL 服务器,并希望在 SQL 服务器和它的数据库内和跨 SQL 服务器建立血统。

有没有一种方法可以通过利用实例内部或跨实例的 SQL 分析或事务日志从 SQL 服务器构建/提取(如果可用)数据沿袭(表和列级别)。

我查看了确定影响和数据沿袭,看起来 SQL 服务器应该启用依赖服务。

作为企业级服务,我可能有权访问 SQL Server,并且可能无法控制启用任何服务的 sql server 实例。

任何人都可以分享有关在 SQL Server 内部或跨 SQL Server 构建或提取数据沿袭的任何见解或经验。

提前致谢 !

迈丁

4

1 回答 1

0

您可以将数据库结构导出到包含 CREATE TABLE/CREATE VIEW/CREATE PROCEDURE 和其他 SQL 语句的 SQL 文件中。然后使用 SQL 解析器分析这些脚本以从这些 SQL 脚本中获取元数据并构建表/列的数据沿袭。

以这个 SQL 为例:

create view deptsal (dept_no, dept_name, salary)
as
SELECT d.deptno, 
       d.dname, 
       SUM(e.sal + Nvl(e.comm, 0)) AS sal 
FROM   dept d 
       left join (SELECT * 
                  FROM   emp 
                  WHERE  hiredate > DATE '1980-01-01') e 
              ON e.deptno = d.deptno 
GROUP  BY d.deptno, 
          d.dname;

您将获得如下数据流:deptsal.salary 取决于 emp.sal、emp.com

于 2018-10-24T13:24:54.013 回答