2

我知道我最近问了几个与 pentaho 相关的问题,但我急于在短时间内评估它:)

我试图克服的最新障碍是我正在构建一个工作,它将在输入文件到达时对其进行处理,但我只知道文件名的格式,而不是确切的文件名本身,并且“等待文件”步骤不知道允许通配符。对于这样一个步骤,这似乎是一个明显的 ommision,所以我想知道我是否错过了一些东西,但在论坛等上似乎我不是唯一面临这种挑战的人。

理想情况下,我需要“等待文件”步骤来搜索通配符/正则表达式,当找到匹配项时,将生成的文件名传递给作业的下一步进行处理。

有什么建议么?

谢谢

汤姆

4

2 回答 2

0

我再次尝试回答你的问题。

实际上,您不需要工作来等待文件。根据我对国家/地区拆分的回答:Pentaho Spoon - 根据字段内容输出到多个文件,您只需要传递源名称,然后使用流程文件将其存档(见下图)。 文本输入对话框

从这里开始,我认为您可以使用我之前提供的 ktr ( http://pentaho.phi-integration.com/kettle/kettle-files/split_countries.ktr ) 来调整我的逻辑。

然后您可以使用作业调度程序控制作业的重复(等待和处理文件)(参见图片)。 在此处输入图像描述

好吧,希望这对汤姆有帮助!

问候,

迪诺

于 2011-05-27T16:21:31.363 回答
0

我有类似的要求,并通过创建一个专门用于接收文件(来自远程主机)的目录来解决这个问题。

“获取文件名”步骤读取目录中的文件并将名称传递给下一步。顺便说一句,“获取文件名”允许使用通配符。

(当然,处理完文件后,我必须清理输入队列。)

编辑:我没有提到你失去了获取文件名的“唤醒”功能,你必须循环和安排目录的定期解析。

于 2011-08-24T13:22:57.727 回答