1

我从 Pentaho 数据集成开始。我正在尝试使用 XML 文件中的数据更新我的数据库。但是,Get data from XML输出的格式不正确。然后,我使用Row denormaliserstep 进行此更正。但是,结果是这样的:

[1]:http: //i.stack.imgur.com/c1cgF.png

我的转变就是这么简单:

[1]:http: //i.stack.imgur.com/r97uL.png

我可以使用一些步骤来合并这些行吗?我尝试使用 Merge Rows Diff、Join Rows 和 Merge Join。这些步骤都没有奏效。

非常感谢!对不起我的英语:)

4

1 回答 1

2

如果我正确理解了您想要实现的目标,我建议您根据数据的第一列(TimeStamp)尝试Group ByMemory Group by ”步骤。在步骤的聚合部分中,根据除 TimeStamp 之外的剩余列使用类型:“sum” (查看下图)

在此处输入图像描述

这会将您的所有行聚合为一个,因为 timstamp 始终保持不变。在“行规范化器”步骤之后使用此步骤。

Merge Rows Diff、Join Rows 和 Merge Join 等步骤也与两个输入流一起使用,以将数据连接或合并为一个。它不进行任何行级聚合。您可以查看 pentaho wiki 了解更多信息:)

希望能帮助到你 :)

于 2015-02-04T12:46:20.173 回答