2

我在我的第一学期学习,并作为我的补偿的一部分。科学作业我必须使用向量实现一个简单的哈希图,但我在理解这个概念时遇到了一些问题。

首先我必须实现一个哈希函数。为了避免冲突,我认为使用双重哈希会更好,如下所示:

do {
    h = (k % m + j*(1+(k % (m-2)));
    j++;
} while ( j % m != 0 );

其中 h 是要返回的哈希,k 是键,m 是 hash_map 的大小(和一个素数;它们都是 int 类型)。

这很容易,但是我需要能够在映射中插入或删除一对键和相应的值。

这两个函数的签名应该是bool,所以我必须返回true或flase,我猜当向量中的位置h没有元素时我应该返回true。(但我不知道为什么 remove 也应该是 bool )。

我的问题是当 insert 函数返回 false 时该怎么办(即,当位置 h 上已经保存了一个键值对时 - 我将其实现为一个名为 find 的函数)。我显然可以通过简单地增加 j 来将它移动到下一个空闲位置,但是我的哈希函数计算的哈希不会再告诉我们某个键保存在哪个位置,从而导致删除函数的错误行为。

网上有没有很好的例子,不使用预先定义的 STD 方法?(我的谷歌在过去几天表现得很奇怪,只用当地语言回复我无用的点击)

4

1 回答 1

2

我被告知将我的评论移至答案,所以就在这里。我假设您的 get 方法采用您正在寻找参数的值。

所以我们要做的是一个叫做线性探测的过程。

当我们插入值时,我们像往常一样对其进行散列假设我们的散列值为 4

[x,x,x,,,x,x]

如我们所见,我们可以简单地将其插入:

[x,x,x,x,,x,x]

但是,如果在插入时取 4,我们将简单地移动到下一个空的插槽

[x,x,x,**x**,x,,x,x]

在线性探测中,如果我们到达终点,我们会循环回到起点,直到找到一个槽。您不应该用完空间,因为您正在使用可以在开始接近满容量时分配额外空间的向量

这会在您搜索时引起问题,因为 4 的值可能不再是 4(在本例中为 5)。为了解决这个问题,我们做了一点小技巧。请注意,只要负载平衡低于 1,我们仍然会得到 O(1) 的插入和检索运行时间复杂度。

在我们的 get 方法中,不是返回数组中 4 处的值,而是开始在 4 处查找我们的值,如果它在那里我们可以返回它。如果不是,我们查看 5 处的值,依此类推,直到找到该值。

伪代码中,新的东西看起来像这样

bool insert(value){
   h = hash(value);
   while(node[h] != null){
      h++;

      if( h = node.length){
          h = 0;
       }
   }
   node[h] = value;

  return true;
}

得到

get(value){
    h = hash(value);
    roundTrip = 0; //used to see if we keep going round the hashmap

   while(true){

      if(node[h] == value)
          return node[h];

      h++;

      if( h = node.length){
          h = 0;
          roundTrip++;
       }

       if(roundTrip > 1){ //we can't find it after going round list once
          return -1;
       }
   }
}
于 2013-07-04T13:36:15.807 回答