4

我正在研究模糊搜索以及如何使用倒排索引从数据库中检索信息。我研究了倒排索引,我认为它只适用于精确匹配。East Lamar Street想象一下我的数据库中有字符串的情况。有人在找East Lmar Street,我在找什么East Lamar Street

它会使用编辑距离吗?

算法将如何运行?

数据库会使用倒排索引吗?

还是会进行全面扫描?

我看到它使用哈希在 O(1) 中进行操作。

4

1 回答 1

2

我编写了一个小型库,该库使用 Soundex 按单词进行索引,并使用 Levenshtein 距离对整个短语进行评分。有一个 scala 和 C# 版本。如果您负担得起将所有街道名称加载到内存中的费用,则可以使用它。否则,您可能会获取一些来源并以不同的方式使用它。

https://github.com/rstokes/fuzzysearch

于 2013-01-19T04:15:58.433 回答