0

在我的源代码提取中,默认情况下只有 16 列。

  1. 在我的第一个文件中,站点名称和活动名称之间有 4 个隐藏列。
  2. 在我的第二个文件中,站点名称和活动名称之间有 2 个隐藏列
  3. 同样,我所有的文件列都隐藏了不同的不同格式。请参考我附上的图片。文件 1 在此处输入图像描述.. 文件 2在此处输入图像描述
  4. 那么如何为所有文件加载创建一个 pentaho 作业。能否请你帮忙 ?谢谢。
4

1 回答 1

0

少量文件: 由于您似乎只有两个文件,最简单的可能是吞下两个具有各自格式的 Excel 文件,然后使用 aSelect values仅保留相关列并将它们合并以进行其余的转换。

PDI 可以合并两个(或更多)输入流,但它要求输入具有完全相同的元数据(相同的列、相同的名称、相同的类型……),这是通过Select value.

在此处输入图像描述

大量文件:

如果您有大量文件,则必须在没有列名(即没有标题)的情况下读取它们,调用列 A、B、C、D、... 然后过滤掉您不感兴趣的列,并更改元数据。

最后,您可以使用Metadata Injection Step.

于 2017-07-26T08:32:19.933 回答