问题标签 [hash-function]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
348 浏览

hash - How to hash fixed size string plus one integer

I have a simple struct consists of a fixed size string and an integer. I need to use this struct as the key for a hash table. I have a hash function for sting, Hs(string), and a hash function for integer, Hi(int), I'm wondering if the hash function for this simple struct would just be H(struct) = Hs(string) + Hi(int)? Alternatively, I could encode the integer into a string and append it to the string, then just use the string hash function. Any suggestions? Thanks.

0 投票
1 回答
239 浏览

python - 生成校验和函数的变化以最小化冲突

0 投票
1 回答
337 浏览

hash - 散列函数将键与常数相乘

公式中键之前的常数如何:

影响表中哈希值的分布?

关于如何选择这样一个常数以最小化冲突并获得哈希表中键的均匀分布是否有任何规则?

0 投票
1 回答
84 浏览

hash - 完美的哈希表

我正在寻找一个利用以下要求的哈希函数:

  • N 个不同的整数值将存储在哈希表中
  • 在任何给定时间点,哈希表中的值不会超过 M
  • 哈希表在几个查询中保持静态(即在某些时候整个哈希表将被初始化,以下调用仅从哈希表中读取)
  • 在哈希表初始化时已知最大可能的键值 K (K >> N)
  • 每个查询到的键值对都存在于哈希表中

到目前为止,我使用的哈希函数如下: h(k) = 7 * k % M with M = PRIME_CLOSE_TO(7*N)

7有点随意。

您对如何改善这一点有什么建议吗?

0 投票
1 回答
1991 浏览

c++ - 我需要一些指导来编写哈希函数来对 ~160,000 个字符串进行排序

我的导师把这个扔给了我们,并告诉我们我们只需要在谷歌上搜索如何编写哈希函数。我在这方面很没有方向。我们为类编写了一个基本的哈希表模板,但我有一个项目,需要将大约 160,000 个字符串分类到一个至少有 500 个桶的表中(我想做更多的速度)。

我只是不知道在哪里可以找到简明易懂的信息。

任何帮助将不胜感激。

0 投票
0 回答
146 浏览

c++ - 通过哈希函数对字符串进行哈希表分布

我的哈希函数如下:

我试图将大约 160,000 个字符串分配到一个表中,每个表包含大约 3-10 个字符串。我很迷茫。

上面的实现是非常头重脚轻的。我的任务要求我至少有 500 个存储桶,但任何高于此的数量就足够了。

有没有人有任何建议/方向?这将不胜感激。

0 投票
2 回答
8742 浏览

c++ - djb2 by Dan Bernstein for c++

我试图从 c 代码翻译 djb2 哈希函数

到 c++ 代码,但我有分段错误。

我的错误在哪里?提前致谢

0 投票
1 回答
991 浏览

java - 处理通用键的哈希函数

是否可以编写一个散列函数来处理通用键或者必须指定类型?我正在尝试为存储键及其值的通用类编写一个哈希表,但我很难开始。

beanStore 存储 bean 对的值 bean 对是 T,N 类型的对象,即它有一个 T 类型的参数和另一个 N 类型的参数

这是 beanFunc 类

0 投票
2 回答
352 浏览

c++ - C++中无序关联容器的哈希函数

在 C++ 中,对于每个无序关联容器(如unordered_mapunordered_setunordered_multimap),我们需要定义一个哈希函数。正如维基百科所指出的,

struct hash_X是 的自定义散列函数struct X。但是这个函数有什么作用呢?为什么我们需要哈希函数?可以有任何其他类型的自定义散列函数吗?如果是这样,我们如何比较任何两个这样的功能之间的效率。

0 投票
3 回答
1099 浏览

python - (1)哈希函数,(2)签名长度和(3)jaccard相似度之间的关系?

我试图在 python 中理解/实现基于 minHash 的 jaccard 相似性。主要目标是在 MapReduce 中使用它。但是我不清楚哈希函数和签名长度的选择如何影响计算jaccard相似度的错误率。从维基百科中,我发现与计算的 jaccard 相似度相关的签名 (K) 和错误 (e) 的一般长度是 k = O(1/e^2)。我尝试在 python 中实现 minHash:

在我的测试中,我发现准确度随着签名长度的增加而增加,但随后它开始下降(或保持稳定)。我想知道是不是因为选择了哈希函数。如果是,有人可以建议使用一个好的散列函数。

我找到了一些相关的帖子,但仍然不清楚: minhash 算法中需要多少个哈希函数