我正在研究音频指纹识别系统,最近阅读了一些论文和研究,尤其是这个页面:c# AudioFingerprinting and Locality Sensitive Hashing
我现在每 32 毫秒的音频就有一系列指纹。我想要做的是使用 LSH 或其他一些相似性保留方法对这些单独的指纹(而不是它们的序列)进行哈希处理。根据我对 LSH 的了解,它适用于多维向量并生成二进制字符串,然后可以在汉明空间中进行比较。
我的问题是我拥有的指纹不是多维的。它们只是单个长整数。我如何使用 LSH 对这些进行哈希处理?是否有任何方法来散列(以保持相似性的方式)一维标量?