0

我想以二进制格式加载一些文件(例如 jpegs,但可以是任何二进制格式),以某种方式对其进行操作并将其写回。我想在 hadoop 上做到这一点,我想在 Cascading 框架上编写它。

是否有可用于二进制格式文件的二进制接收器/选项卡?还有其他方法吗?

我什么也找不到。我能想到的唯一选择可能是我应该实现自己的hadoop InputFormat,它将文件读取为字节数组或java ByteBuffer,但我觉得没有内置解决方案很奇怪(因为我确定我'不是第一个遇到这个问题的人)。

如果有人有任何指示,将不胜感激

4

1 回答 1

2

您必须编写自己的 HadoopInputFormat来处理二进制数据,然后将该 InputFormat 包装在自定义 CascadingScheme中。从好的方面来说,您不需要自定义Tap.

这一切都来自级联作者本人。

于 2013-07-19T17:24:13.110 回答