1

我有一个输入文件,我需要在其上自定义RecordReader. 但是,这里的问题是,数据可能会分布在不同的输入拆分中,并且不同的映射器可能会获得应该由第一个映射器使用的数据。

例如
ABCD
$ EF

开头的“$”表示它是上一行的延续。

考虑到,第二次拆分从 $ 开始。现在,我的第一个映射器不会知道第一行的延续。另请注意,我的数据中很可能根本没有任何第二行。所以,直到或除非我读到第二行,我才能知道我的数据有什么延续。

请帮我找到解决这个问题的方法。

4

0 回答 0