我想以二进制格式加载一些文件(例如 jpegs,但可以是任何二进制格式),以某种方式对其进行操作并将其写回。我想在 hadoop 上做到这一点,我想在 Cascading 框架上编写它。
是否有可用于二进制格式文件的二进制接收器/选项卡?还有其他方法吗?
我什么也找不到。我能想到的唯一选择可能是我应该实现自己的hadoop InputFormat,它将文件读取为字节数组或java ByteBuffer,但我觉得没有内置解决方案很奇怪(因为我确定我'不是第一个遇到这个问题的人)。
如果有人有任何指示,将不胜感激