0

我正在尝试使用 Talend 实现文件夹中文件的列合并。(文件是本地的)

示例:- 一个文件夹中有 4 个文件。(也可能有“n”个文件)

每个文件将有一列有 100 个值。

因此,合并后,输出文件将有 4 或“n”个列,其中包含 100 条记录。

是否可以使用 Talend 组件以这种方式合并?

尝试使用 tmap 中的 2 个文件,输出记录成倍增加(第一个文件中的记录 * 第二个文件中的记录)。

任何帮助,将不胜感激。

谢谢。

4

1 回答 1

0

您必须确定如何连接来自不同文件的数据。如果每个文件的行号 N 必须与其他文件的行号 N 匹配,那么您必须在每个文件上设置一个序列,并加入序列以获得您的结果。小心,您完全取决于每个文件中数据的顺序。

然后你可以有这份工作:

tFileInputdelimited_1 --> tMap_1 --->{tMap_5
tFileInputdelimited_2 --> tMap_2 --->{tMap_5
tFileInputdelimited_3 --> tMap_3 --->{tMap_5
tFileInputdelimited_4 --> tMap_4 --->{tMap_5

在从 1 到 4 的 tMaps 中,将输入复制到输出,并在输出中添加“序列”列(数据类型整数),用Numeric.sequence("IDENTIFIER1",1,1). 然后你在输出中有 2 列:你的数据和一个唯一的序列。小心为每个来源使用不同的标识符。

然后在 tMap_5 中,只需加入不同的序列,并获取您的 inputColumn。

于 2017-02-21T14:24:50.683 回答