0

工作信息

我有两个不同的数据集源,所以我在数据工厂中创建了一个数据流,其中对于第一个数据(A)集我正在做一些转换并加载到接收器中,在另一个数据集(B)中同样正在执行一些转换和加载到另一个水槽。

问题

现在我有一些要求,其中第一个数据集(A)中有日期列 DT_COLUMN_A(11-04-2020 01:17:40) 需要与日期列 DT_COLUMN_B(01-01-2020 16:32 :00) 在第二个数据集 (B) 中,并将比较的输出作为列存储在第二个数据集 (B) 中。

所以我需要数据集 A 中日期列的最小值和最大值(日期范围),将其应用于数据集 B 的日期列的最小值和最大值,并找到在 A 和 B 中匹配的日期,如果不匹配 NO,则将其存储为 YES .

代码方法思想

需要的逻辑:

if(min(DT_COLUMN_A) and max(DT_COLUMN_A) == min(DT_COLUMN_B) and max(DT_COLUMN_B) then YES else No.

我试图在 ADF 数据流中实现这一点,但无法做到。

4

1 回答 1

0

要在 ADF 中获取数据集的 MIN 和 MAX,您将需要聚合转换。使用聚合从数据流中的每个相关流创建名为 MinA、MinB、MaxA、MaxB 的新列。将聚合函数分别设置为 MIN 和 MAX。然后,您将能够在之后设置 iif() 表达式,或使用使用那些存储的最小值和最大值的过滤器或条件拆分转换。

于 2020-08-25T16:28:36.303 回答