key - hadoop 或 java 中的字节偏移值是多少？

Question

我对这个术语有点困惑，一个字节偏移值，它在 Hadoop Map reduce 程序中被视为映射键。

首先，字节偏移值是多少？

其次，它是如何生成的，如何看待这个字节偏移值？

score 6 · Accepted Answer

字节偏移量是从行首开始计数的字符数。

例如，这条线

what is byte offset?

将有一个 19 的字节偏移量。这在 hadoop 中用作键值

score 2 · Accepted Answer

基本上，偏移量是一个整数，用于查找相对于基地址的距离（绝对地址）。

假设一个文本文件包含以下数据

计算机科学世界
量子计算

现在第一行的偏移量为 0，hadoop 作业的输入将是 <0,Computer Science World> 第二行的偏移量将是 <23,Quantum Computing>

每当我们将文本文件传递给 hadoop 作业时。它在内部计算字节偏移量。

score 1 · Accepted Answer

字节偏移量是从零开始的字节数。在谈到 Hadoop 时，一个字符或空格通常是一个字节。但是，如果您想了解更多信息，请查看这个问题：一个字符有多少位？

3 回答 3