我目前在使用我实现的模糊字符串匹配器时遇到问题。我希望能够在不到一秒左右的时间内使用 Javascript 快速确定 10,000 个短语列表中的哪些短语与字典中 200,000 个短语中的任何一个的编辑距离不超过 2。这些短语平均每个大约 15 个字符。我不关心有多少匹配,甚至不关心匹配是什么,只关心是否匹配。我可以事先对字典中我想要的单词进行任何索引,但对其他单词则没有。
我的主要方法是使用 BK 树。对所有 10,000 个单词进行分类通常需要大约 130-140 秒,因此比我希望的要低两个数量级。能够在 Javascript 中快速对短语进行分类是否现实?如果是这样,我应该使用什么技术,有没有比 BK 树更快的方法来解决此类问题?