我正在寻找用于拼写校正的 AI 算法,我发现 Levenshtein 距离算法可以比较两个字符串之间的相似性,所以我的问题是我应该在错误的单词与我字典中的所有单词之间实现这种相似性吗?因为如果是的话,时间运行会很慢。我的第二个问题可以在两个长度不同的字符串上实现这个算法,谢谢
问问题
359 次
1 回答
0
如果您使用 Java 或 JavaScript,我有一个库,可以在查询词的长度上以线性时间在您的字典中找到所有拼写候选:
https://github.com/universal-automata/liblevenshtein-java
诀窍在于它将 Levenshtein 自动机与您的字典自动机相交,并且只遵循那些导致 Levenshtein 距离不大于您从查询词中指定的词条的路径。
我已经设置了一个你可以玩的演示:
于 2016-05-10T03:30:33.423 回答