3

我对 Hadoop 很陌生,我想将半结构化数据 - XML 导入 HDFS。将 XML 数据从远程位置导入 HDFS 和任何用于它的开源工具的方法是什么?Flume 可以将 XML 数据导入 HDFS 吗?提前致谢

4

1 回答 1

1

您可以尝试编写使用 HDFS Java API 在 HDFS 中创建文件并将 XML 的全部内容写入每个文件中。

是的,如果从源代码生成大量 XML 文件并希望将其放入 HDFS 中,您也可以使用水槽。

你可以看看这些链接: http ://www.dummies.com/how-to/content/log-data-with-flume-in-hdfs.html

于 2015-12-27T12:52:55.613 回答