c++ - 非常基本的 MurmurHash 问题：len 的变量描述，C++ 实现的关键

Question

我正在尝试将 MurmurHash 改编为为一个类构建的程序，但我似乎无法找到关于变量代表什么的明确确认。

我使用以下内容作为参考：

unsigned int MurmurHash2 ( const void * key, int len, unsigned int seed )
{
    // 'm' and 'r' are mixing constants generated offline.
    // They're not really 'magic', they just happen to work well.

    const unsigned int m = 0x5bd1e995;
    const int r = 24;

    // Initialize the hash to a 'random' value

    unsigned int h = seed ^ len;

    // Mix 4 bytes at a time into the hash

    const unsigned char * data = (const unsigned char *)key;

    while(len >= 4)
    {
        unsigned int k = *(unsigned int *)data;

        k *= m; 
        k ^= k >> r; 
        k *= m; 

        h *= m; 
        h ^= k;

        data += 4;
        len -= 4;
    }

    // Handle the last few bytes of the input array

    switch(len)
    {
    case 3: h ^= data[2] << 16;
    case 2: h ^= data[1] << 8;
    case 1: h ^= data[0];
            h *= m;
    };

    // Do a few final mixes of the hash to ensure the last few
    // bytes are well-incorporated.

    h ^= h >> 13;
    h *= m;
    h ^= h >> 15;

    return h;
}

据我了解，哈希函数将获取一些值并将其放入哈希表中。“len”是散列表的大小，“key”是要散列的值吗？

score 0 · Accepted Answer

以下是它们所代表的：

unsigned int MurmurHash2 ( const void * key, int len, unsigned int seed )

key- 指向要为其生成哈希值的字节数组

len-key指向的字节数（或至少，您希望包含在计算哈希值的输入中的字节数）

seed- 为此选择您想要的任何值；如果您使用不同的种子值，您将获得给定输入的不同哈希码。如果有疑问，请始终传入零。

返回根据传入字节计算的哈希值。对于相同的字节序列，您总是会得到相同的哈希值（假设您也传递了相同的seed值），但是对于不同的字节序列，返回的哈希值会有很大差异（即即使输入字节的差异很小可能会导致返回的哈希值非常不同）

据我了解，哈希函数将获取一些值并将其放入哈希表中。“len”是散列表的大小，“key”是要散列的值吗？

这是不正确的。MurmurHash2() 仅计算哈希码，因此 MurmurHash2() 可以用作哈希表实现的一部分，但它本身并不实现哈希表。

c++ - 非常基本的 MurmurHash 问题：len 的变量描述，C++ 实现的关键

1 回答 1

Related

Reference