我正在尝试为最近邻搜索创建一个 forst,但我不确定我做对了,或者即使 MinHash / LSH 是否适合我的数据。我问这个是因为结果不可用。
我正在尝试按照文档中的示例进行操作。
我的数据:
512 个维度,例如值有点像 0 或 1 这实际上可用于 MinHash / LSH 吗?如果是,我将如何为每条记录构造 MinHash?
据我了解,minhash 的重点已经是将数据映射到这样的位结构?所以我可以把这些位加载进去吗?如h = MinHash(num_perm=512, hashvalues=listOfBits)
?