我必须使用 hadoop mapreduce 代码解析 x12 文件。有人可以建议我如何做到这一点吗?解析后的输出应该可以被其他一些 hadoop 工具使用,比如 hive
谢谢, 罗克托
我必须使用 hadoop mapreduce 代码解析 x12 文件。有人可以建议我如何做到这一点吗?解析后的输出应该可以被其他一些 hadoop 工具使用,比如 hive
谢谢, 罗克托
我们需要更多信息,但在高层次上:
根据您的语言获取或创建 X12 解析器。 https://code.google.com/p/x12-parser/ http://www.smooks.org/mediawiki/index.php?title=Main_Page
决定你的 mapreduce 工作要输出什么:
编写一个获取 X12 文档的作业(您没有说明它们是如何存储的,但我假设您在 X12 的 HDFS 中有文件),并使用您的解析器向下游发出您想要的任何内容。