给定一个数字向量:V=(v1, v2, ..., vn)。这 n 个数字不需要区分或排序。
假设我们有几个向量 V1, V2, ..., Vm。可以用一个数(整数或浮点数)来唯一地表示每个向量,这样对于任何一个不等于 Vj 的 Vi,对应的数 f(Vi) 和 f(Vj) 也不相等。
一个简单的解决方案是用一个从 0 到 m-1 范围内的数字作为 ID 来表示一个向量,但是我们假设这种解决方案在每个向量存储在几个分布式机器中的情况下是行不通的。也就是说,两台机器中的向量部分可能会重叠,并且算法不知道全局向量的分布。