我正在查看 Java 程序中的选项,这些选项可以将文件写入 HDFS 并满足以下要求。
1)事务支持:每个文件在写入时,要么完全写入成功,要么完全失败,没有写入任何部分文件块。
2) Compression Support/File Formats:可在写入内容时指定压缩类型或文件格式。
我知道如何通过打开此处FSDataOutputStream
显示的文件将数据写入 HDFS 上的文件。只是想知道是否有一些开箱即用的解决方案库可以提供我上面提到的支持。
我偶然发现了 Flume,它提供了可以支持事务、压缩、文件旋转等的 HDFS 接收器。但它似乎没有提供用作库的 API。Flume 提供的功能与 Flume 架构组件(如源、通道和接收器)高度耦合,似乎不能独立使用。我只需要在 HDFS 加载部分。
有没有人有一些好的建议?