我对这个术语有点困惑,一个字节偏移值,它在 Hadoop Map reduce 程序中被视为映射键。
首先,字节偏移值是多少?
其次,它是如何生成的,如何看待这个字节偏移值?
我对这个术语有点困惑,一个字节偏移值,它在 Hadoop Map reduce 程序中被视为映射键。
首先,字节偏移值是多少?
其次,它是如何生成的,如何看待这个字节偏移值?
字节偏移量是从行首开始计数的字符数。
例如,这条线
what is byte offset?
将有一个 19 的字节偏移量。这在 hadoop 中用作键值
基本上,偏移量是一个整数,用于查找相对于基地址的距离(绝对地址)。
假设一个文本文件包含以下数据
计算机科学世界
量子计算
现在第一行的偏移量为 0,hadoop 作业的输入将是 <0,Computer Science World> 第二行的偏移量将是 <23,Quantum Computing>
每当我们将文本文件传递给 hadoop 作业时。它在内部计算字节偏移量。
字节偏移量是从零开始的字节数。在谈到 Hadoop 时,一个字符或空格通常是一个字节。但是,如果您想了解更多信息,请查看这个问题: 一个字符有多少位?