我在使用哈希函数时遇到问题。我必须为文档中的每个单词分配一些数字(128 位或 64 位)。因此,“相似度”的哈希值必须与“相似度”相近。这意味着,如果相似度的值=>10022(比如说),那么相似度=>10025。这应该与相似的词接近。不同名称的哈希值也应该相似。这意味着,“john”的哈希值也应该接近“michel”或“sita”......等等。如果任何人对此有任何想法。
先谢谢了。:)
我在使用哈希函数时遇到问题。我必须为文档中的每个单词分配一些数字(128 位或 64 位)。因此,“相似度”的哈希值必须与“相似度”相近。这意味着,如果相似度的值=>10022(比如说),那么相似度=>10025。这应该与相似的词接近。不同名称的哈希值也应该相似。这意味着,“john”的哈希值也应该接近“michel”或“sita”......等等。如果任何人对此有任何想法。
先谢谢了。:)