0

我正在尝试使用 Pentaho 数据集成 (KETTLE) 读取 Golden Gate 的跟踪文件,但我不知道该怎么做?任何人都请帮助我如何阅读金门的踪迹文件。

提前致谢。

问候,森希尔。

4

1 回答 1

1

金门小径有一个非平凡的结构:

https://docs.oracle.com/goldengate/1212/gg-winux/GWUAD/wu_fileformats.htm

应该可以用 PDI 来解析它,但是这样的解决方案会非常复杂。以下是一些可能的方法:

1)尝试将文件拆分为各个“区域”,并逐个处理这些区域,可能还进行子转换以使其模块化和有条理。

2) 如果您要在文件中查找文本,您可以使用 PDI 市场中的“从文件中加载文本”插件。它使用Apache Tika尝试从文档中提取文本。

3)如果你愿意写代码来做这件事,它会成为一个很棒的PDI插件:)当我遇到复杂的文件结构时,我通常会写一个ANTLR语法来做解析,然后我写一个PDI插件来调用解析器并将值转换为 PDI 行(即表格)格式。

于 2014-12-03T14:19:24.000 回答