1

我必须使用 hadoop mapreduce 代码解析 x12 文件。有人可以建议我如何做到这一点吗?解析后的输出应该可以被其他一些 hadoop 工具使用,比如 hive

谢谢, 罗克托

4

1 回答 1

0

我们需要更多信息,但在高层次上:

  1. 根据您的语言获取或创建 X12 解析器。 https://code.google.com/p/x12-parser/ http://www.smooks.org/mediawiki/index.php?title=Main_Page

  2. 决定你的 mapreduce 工作要输出什么:

    • 每个 X12 文档的 XML 树
    • 一堆片段
    • ???
  3. 编写一个获取 X12 文档的作业(您没有说明它们是如何存储的,但我假设您在 X12 的 HDFS 中有文件),并使用您的解析器向下游发出您想要的任何内容。

于 2014-11-20T22:21:16.643 回答