我正在尝试使用 Pentaho 数据集成 (KETTLE) 读取 Golden Gate 的跟踪文件,但我不知道该怎么做?任何人都请帮助我如何阅读金门的踪迹文件。
提前致谢。
问候,森希尔。
我正在尝试使用 Pentaho 数据集成 (KETTLE) 读取 Golden Gate 的跟踪文件,但我不知道该怎么做?任何人都请帮助我如何阅读金门的踪迹文件。
提前致谢。
问候,森希尔。
金门小径有一个非平凡的结构:
https://docs.oracle.com/goldengate/1212/gg-winux/GWUAD/wu_fileformats.htm
应该可以用 PDI 来解析它,但是这样的解决方案会非常复杂。以下是一些可能的方法:
1)尝试将文件拆分为各个“区域”,并逐个处理这些区域,可能还进行子转换以使其模块化和有条理。
2) 如果您要在文件中查找文本,您可以使用 PDI 市场中的“从文件中加载文本”插件。它使用Apache Tika尝试从文档中提取文本。
3)如果你愿意写代码来做这件事,它会成为一个很棒的PDI插件:)当我遇到复杂的文件结构时,我通常会写一个ANTLR语法来做解析,然后我写一个PDI插件来调用解析器并将值转换为 PDI 行(即表格)格式。