9

我对这个术语有点困惑,一个字节偏移值,它在 Hadoop Map reduce 程序中被视为映射键。

首先,字节偏移值是多少?

其次,它是如何生成的,如何看待这个字节偏移值?

4

3 回答 3

6

字节偏移量是从行首开始计数的字符数。

例如,这条线

what is byte offset?

将有一个 19 的字节偏移量。这在 hadoop 中用作键值

于 2014-07-18T17:48:35.063 回答
2

基本上,偏移量是一个整数,用于查找相对于基地址的距离(绝对地址)。

假设一个文本文件包含以下数据

计算机科学世界
量子计算

现在第一行的偏移量为 0,hadoop 作业的输入将是 <0,Computer Science World> 第二行的偏移量将是 <23,Quantum Computing>

每当我们将文本文件传递给 hadoop 作业时。它在内部计算字节偏移量。

于 2016-03-11T23:48:43.363 回答
1

字节偏移量是从零开始的字节数。在谈到 Hadoop 时,一个字符或空格通常是一个字节。但是,如果您想了解更多信息,请查看这个问题: 一个字符有多少位?

于 2015-10-27T18:58:21.287 回答