我必须在 C 中为我的代码使用散列函数,并且我发现了我认为的 murmurhash 3(32 位)散列函数。
我无法理解输入 len 和 seed 的内容。
我在 len 和 seed 中输入了任意值作为参数,它们分别为 2,000 和 2,但我得到了非常长的数字,例如 -1837466777 或 5738837646(不准确,但在结构上与我得到的结果相似)。我还看到了一些关于对其进行位掩码等的内容。
关于第一个问题,我的问题是以简单的方式解释 len 和 seed。
我关于第二个的问题是我想知道如何处理该值(如果它是有效的返回值)以获得可用于我的哈希表的实际键
请让你的解释尽可能简单和分解。对于我无法理解复杂的数学组合和高级定理,我深表歉意,我只需要一个实用的答案,以便我可以立即使用它,然后再研究它周围的复杂性。
非常感谢你,我真的很感激任何帮助。
下面是代码:
uint32_t murmur3_32(const char *key, uint32_t len, uint32_t seed)
{
static const uint32_t c1 = 0xcc9e2d51;
static const uint32_t c2 = 0x1b873593;
static const uint32_t r1 = 15;
static const uint32_t r2 = 13;
static const uint32_t m = 5;
static const uint32_t n = 0xe6546b64;
uint32_t hash = seed;
const int nblocks = len / 4;
const uint32_t *blocks = (const uint32_t *) key;
int i;
for (i = 0; i < nblocks; i++) {
uint32_t k = blocks[i];
k *= c1;
k = (k << r1) | (k >> (32 - r1));
k *= c2;
hash ^= k;
hash = ((hash << r2) | (hash >> (32 - r2))) * m + n;
}
const uint8_t *tail = (const uint8_t *) (key + nblocks * 4);
uint32_t k1 = 0;
switch (len & 3) {
case 3:
k1 ^= tail[2] << 16;
case 2:
k1 ^= tail[1] << 8;
case 1:
k1 ^= tail[0];
k1 *= c1;
k1 = (k1 << r1) | (k1 >> (32 - r1));
k1 *= c2;
hash ^= k1;
}
hash ^= len;
hash ^= (hash >> 16);
hash *= 0x85ebca6b;
hash ^= (hash >> 13);
hash *= 0xc2b2ae35;
hash ^= (hash >> 16);
return hash;
}