我知道 Hadoop 流中的文本记录由换行符分隔,并且键和值之间有一个可配置的分隔符(默认为制表符)。
1) rawbytes 格式的结构表明不需要记录或键/值分隔符,但有人可以确认是这种情况吗?
2)在typedbytes格式中,key和value是如何分隔的,record是如何分隔的?
3)另外,键是如何以 typedbytes 和 rawbytes 格式排序的?
我知道 Hadoop 流中的文本记录由换行符分隔,并且键和值之间有一个可配置的分隔符(默认为制表符)。
1) rawbytes 格式的结构表明不需要记录或键/值分隔符,但有人可以确认是这种情况吗?
2)在typedbytes格式中,key和value是如何分隔的,record是如何分隔的?
3)另外,键是如何以 typedbytes 和 rawbytes 格式排序的?
见 https://hadoop.apache.org/docs/current2/api/org/apache/hadoop/typedbytes/package-summary.html
安东尼奥