我正在尝试找到一种方法来快速访问(优于 O(n))来存储我的数据。
我的数据库由代表有关某些项目的一些信息的数据(4096 字节字符串)组成。
问题是,查询永远不会准确。我得到一个项目,然后需要使用函数找到最接近的匹配项F(a,b)
。
只是一个例子:
1234
3456
6466
F(a,b) = return % of similar digits
GetClosest(1233,F) = 1234
问题是 F(a,b) 是一个复杂的算法,(不是一个适当的度量)。
我现在所拥有的只是遍历整个数据库以搜索最佳匹配。
是否有一种树或其他集群数据库类型可以让我更快地找到复杂性?
更多信息:
F 以百分比返回相似度值。其中 100% 是完美匹配。