我想在我的 Java 代码中覆盖 Hadoop 的默认记录阅读器。它默认逐行读取记录。我在遇到“:”时更改了它,将记录分开。但是,在分隔记录时,它也会发出分隔符。例如,我的记录是:
> I go to school : He goes to school : we go to school
读取记录时,它会产生如下结果:
I go to school
He goes to school
we go to school
但是分隔符 - “:”不见了。有没有办法将此分隔符保存在记录中?因为分隔符中可能有一些重要的信息。