3

我很难找到符合我要求的字符串匹配算法。

我有一个非常大的未缩写形式的字符串数据库,需要与任意缩写匹配。作为实际子字符串的字符串,其字符之间没有字母也应该匹配,并且得分更高。

示例:如果要匹配的单词是“download”,我搜索“down”,“ownl”,然后是“dl”,我会得到“down”的最高匹配分数,其次是“ownl”,然后是“ dl”。

该算法必须针对速度和要搜索的大量字符串进行优化,并且应该允许我拉回匹配项字符串的列表(如果我将“下载”和“上传”都添加到数据库中,搜索“负载”应该返回两者)。内存仍然很重要,但不如速度重要。

有任何想法吗?我已经对其中一些算法进行了大量研究,但我还没有发现任何涉及缩写的方法,更不用说所有这些条件了!

4

1 回答 1

0

我想知道 Peter Norvig 的拼写检查器是否可以以某种方式适应这个问题。

这是一个我还没有开始解决的问题,但它是如此优雅的解决方案,值得了解。

于 2010-02-21T03:53:22.267 回答