我收到了各种平面文件,在将它们加载到 SQL Server 数据库之前,这些文件需要在 ETL 过程的几个阶段进行转换和聚合。
在每个阶段之后,我想以多种方式验证数据,并且我正在研究可以提供帮助的现有技术。
接收到数据后,需要对截断数据、日期格式等内容进行验证,并通常确保数据已准备好进行转换。
数据这样清洗干净后,我想对数据进行校验。这将包括将诸如行计数、空值百分比、平均值等值与先前的负载或预定义值进行比较。如果验证失败,则应提醒开发人员。
tSQLt,数据库单元测试框架,有几个断言可以用来做我想做的事。它很容易设置并且有不错的文档。这是我能看到的最近的工具,但距离它的设计目的还有很长的路要走。
另一种方法是创建我自己的工具,但我想知道 - 这样的东西是否已经存在?