我正在尝试使用 Talend 实现文件夹中文件的列合并。(文件是本地的)
示例:- 一个文件夹中有 4 个文件。(也可能有“n”个文件)
每个文件将有一列有 100 个值。
因此,合并后,输出文件将有 4 或“n”个列,其中包含 100 条记录。
是否可以使用 Talend 组件以这种方式合并?
尝试使用 tmap 中的 2 个文件,输出记录成倍增加(第一个文件中的记录 * 第二个文件中的记录)。
任何帮助,将不胜感激。
谢谢。
我正在尝试使用 Talend 实现文件夹中文件的列合并。(文件是本地的)
示例:- 一个文件夹中有 4 个文件。(也可能有“n”个文件)
每个文件将有一列有 100 个值。
因此,合并后,输出文件将有 4 或“n”个列,其中包含 100 条记录。
是否可以使用 Talend 组件以这种方式合并?
尝试使用 tmap 中的 2 个文件,输出记录成倍增加(第一个文件中的记录 * 第二个文件中的记录)。
任何帮助,将不胜感激。
谢谢。
您必须确定如何连接来自不同文件的数据。如果每个文件的行号 N 必须与其他文件的行号 N 匹配,那么您必须在每个文件上设置一个序列,并加入序列以获得您的结果。小心,您完全取决于每个文件中数据的顺序。
然后你可以有这份工作:
tFileInputdelimited_1 --> tMap_1 --->{tMap_5
tFileInputdelimited_2 --> tMap_2 --->{tMap_5
tFileInputdelimited_3 --> tMap_3 --->{tMap_5
tFileInputdelimited_4 --> tMap_4 --->{tMap_5
在从 1 到 4 的 tMaps 中,将输入复制到输出,并在输出中添加“序列”列(数据类型整数),用Numeric.sequence("IDENTIFIER1",1,1)
. 然后你在输出中有 2 列:你的数据和一个唯一的序列。小心为每个来源使用不同的标识符。
然后在 tMap_5 中,只需加入不同的序列,并获取您的 inputColumn。