0

我必须在 C 中为我的代码使用散列函数,并且我发现了我认为的 murmurhash 3(32 位)散列函数。

  1. 我无法理解输入 len 和 seed 的内容。

  2. 我在 len 和 seed 中输入了任意值作为参数,它们分别为 2,000 和 2,但我得到了非常长的数字,例如 -1837466777 或 5738837646(不准确,但在结构上与我得到的结果相似)。我还看到了一些关于对其进行位掩码等的内容。

关于第一个问题,我的问题是以简单的方式解释 len 和 seed。

我关于第二个的问题是我想知道如何处理该值(如果它是有效的返回值)以获得可用于我的哈希表的实际键

请让你的解释尽可能简单和分解。对于我无法理解复杂的数学组合和高级定理,我深表歉意,我只需要一个实用的答案,以便我可以立即使用它,然后再研究它周围的复杂性。

非常感谢你,我真的很感激任何帮助。

下面是代码:

uint32_t murmur3_32(const char *key, uint32_t len, uint32_t seed)
{
    static const uint32_t c1 = 0xcc9e2d51;
    static const uint32_t c2 = 0x1b873593;
    static const uint32_t r1 = 15;
    static const uint32_t r2 = 13;
    static const uint32_t m = 5;
    static const uint32_t n = 0xe6546b64;

    uint32_t hash = seed;

    const int nblocks = len / 4;
    const uint32_t *blocks = (const uint32_t *) key;
    int i;
    for (i = 0; i < nblocks; i++) {
        uint32_t k = blocks[i];
        k *= c1;
        k = (k << r1) | (k >> (32 - r1));
        k *= c2;

        hash ^= k;
        hash = ((hash << r2) | (hash >> (32 - r2))) * m + n;
    }

    const uint8_t *tail = (const uint8_t *) (key + nblocks * 4);
    uint32_t k1 = 0;

    switch (len & 3) {
    case 3:
        k1 ^= tail[2] << 16;
    case 2:
        k1 ^= tail[1] << 8;
    case 1:
        k1 ^= tail[0];

        k1 *= c1;
        k1 = (k1 << r1) | (k1 >> (32 - r1));
        k1 *= c2;
        hash ^= k1;
    }

    hash ^= len;
    hash ^= (hash >> 16);
    hash *= 0x85ebca6b;
    hash ^= (hash >> 13);
    hash *= 0xc2b2ae35;
    hash ^= (hash >> 16);

    return hash;
}
4

0 回答 0