我需要一些帮助来设计一种在 Talend 作业(Java 作业,而不是 Perl)中解析 JSON 文档的策略。我正在使用 Talend 版本:5.0.2 并在 Mac 上开发,计划在 Linux 机器上运行。
不幸的是,由于我的文件格式,我无法使用 tFileInputJSON 组件——每个文件包含数百个 JSON 文档,一个完整的 JSON 文档占据文件中的一行。我认为正确的解决方案是逐行读取文件,然后将其传递到 JSON 解析器,然后从那里将结果发送到工作的其余部分。
在我看来,我的选择是:
a) 将行输入发送到某种 Java JSON 解析器。如果这是我需要采取的策略,我想要一些关于如何处理输出和获取的建议
b) 找到解析 JSON 文档的 Talend 组件,但在流中,而不是在有效 JSON 格式的单个文件中。
我四处寻找这个组件,但似乎找不到它。从我的搜索来看,tFileInputJSON 组件似乎也相对较新。
我绝对知道这是 Java 可以轻松完成的事情。我的问题是让整个事情在 Talend 框架内同步。
有人对我下一步应该转向哪里有一些建议吗?
提前致谢。