2

请考虑以下情况:在一段文本中,字符串“slnFile”出现五次,“snlFile”出现一次。后者是拼写错误,但请注意,前一个词不在正确的字典中(“slnFile”是一个变量名,表示“Visual Studio 解决方案文件”,仅对文本段的作者有意义)。

我自己可以想到一个简单的拼写检查实现:在文本段中查找拼写不同一个字符的所有单词对,将频率计数为 1 的任何单词指示为可疑单词。(我知道这不是一个完美的解决方案。)

我的问题:处理这个问题的算法类的名称是什么?

4

1 回答 1

2

计算词汇表中所有单词之间的Damerau-Levenshtein 距离。标记那些非常不频繁出现并且与频繁出现的单词的距离特别小的单词。

于 2013-09-10T21:33:33.007 回答