是否有任何消息摘要算法可以在摘要上应用集合函数并且结果仍然有意义?换句话说,是否有一个散列函数在散列之前和之后不打破“集合”的概念?
我正在寻找一个哈希函数:
- 将一组数据散列成一个固定长度(或有界长度)的字符串
- 如果输入数据集相同,则产生相同的哈希
- 如果您选择原始数据的子集,则相当于对数据子集进行哈希处理,或者将子集应用于原始数据集的哈希,即您将在两种方式中获得相同的子集哈希。
例如,在下图中,A 有几个数据点(红色菱形)。B 是 A 的子集。是否存在这样的哈希函数:
A中的数据----哈希函数---->_hashA----设置操作---->_hashB
B中的数据----哈希函数----> _hashB