1

根据我之前的问题,当我的数据中包含可变数量的地址时,如何使用 Informatica PowerCenter Designer 对数据进行透视。我想从我的数据中透视例如四个地址。这是源数据文件的结构:

+---------+--------------+-----------------+
| ADDR_ID |     NAME     |     ADDRESS     |
+---------+--------------+-----------------+
|       1 | John Smith   | JohnsAddress1   |
|       1 | John Smith   | JohnsAddress2   |
|       1 | John Smith   | JohnsAddress3   |
|       2 | Adrian Smith | AdriansAddress1 |
|       2 | Adrian Smith | AdriansAddress2 |
|       3 | Ivar Smith   | IvarAddress1    |
+---------+--------------+-----------------+

这应该是结果表:

+---------+--------------+-----------------+-----------------+---------------+----------+
| ADDR_ID |     NAME     |    ADDRESS1     |    ADDRESS2     |   ADDRESS3    | ADDRESS4 |
+---------+--------------+-----------------+-----------------+---------------+----------+
|       1 | John Smith   | JohnsAddress1   | JohnsAddress2   | JohnsAddress3 | NULL     |
|       2 | Adrian Smith | AdriansAddress1 | AdriansAddress2 | NULL          | NULL     |
|       3 | Ivar Smith   | IvarAddress1    | NULL            | NULL          | NULL     |
+---------+--------------+-----------------+-----------------+---------------+----------+

我想我可以使用

源 --> SOURCE_QUALIFIER --> 排序器 --> 聚合器 --> 表达式 --> 目标表

但是我应该在 AGGREGATOR 和 EXPRESSION 转换中使用哪种端口?

4

2 回答 2

1

尝试这个:

源 --> SOURCE_QUALIFIER --> 排名 --> 聚合器 --> 目标

在 RANK 转换中,按 ADDR_ID 分组并选择 ADDRESS 作为排名端口。在属性选项卡中,选择等级数为 4。

在 AGGREGATOR 转换中按 ADDR_ID 分组并使用以下输出端口表达式(RANKINDEX 将由 RANK 转换生成):

ADDRESS1 = MAX(ADDRESS,RANKINDEX=1)
ADDRESS2 = MAX(ADDRESS,RANKINDEX=2)
ADDRESS3 = MAX(ADDRESS,RANKINDEX=3)
ADDRESS4 = MAX(ADDRESS,RANKINDEX=4)
于 2013-10-10T19:51:30.977 回答
1

您应该使用以下内容:

Source->Expression->Aggregator->Target

在表达式中,添加一个变量端口:

v_count expr: IIF(ISNULL(v_COUNT) OR v_COUNT=3, 1, v_COUNT + 1)

或者

v_count expr:  IIF(ADDR_ID=v_PREVIOUS_ADDR_ID, v_COUNT + 1, 1)

和3个输出端口:

o_addr1 expr: DECODE(TRUE, v_COUNT=1, ADDR_IN, NULL)
o_addr2 expr: DECODE(TRUE, v_COUNT=2, ADDR_IN, NULL)
o_addr3 expr: DECODE(TRUE, v_COUNT=3, ADDR_IN, NULL)

然后使用聚合器,按 ID 分组并始终选择 Max,例如

agg_addr1: expr: MAX(O_ADDR1)
agg_addr2: expr: MAX(O_ADDR2)
agg_addr3: expr: MAX(O_ADDR3)

如果您需要更多非规范化端口,请添加其他端口并相应地设置 v_count 变量的初始状态。

于 2013-10-10T20:00:56.540 回答