我正在研究 C++ 中的拼写检查器,但我被困在实现的某个步骤。
假设我们有一个包含正确拼写单词的文本文件和一个我们想要检查拼写错误的输入字符串。如果该字符串是拼写错误的单词,我可以通过检查文本文件中的所有单词并选择与它不同且字母最少的单词来轻松找到其正确形式。对于这种类型的输入,我实现了一个计算 2 个字符串之间的 Levenshtein 编辑距离的函数。到目前为止,一切都很好。
现在,困难的部分:如果输入的字符串是拼写错误的单词的组合怎么办?例如,“iloevcokies”。考虑到“i”、“love”和“cookies”是可以在文本文件中找到的词,我如何使用已经实现的 Levenshtein 函数来确定文件中哪些词适合更正?另外,我如何在正确的位置插入空白?
欢迎任何想法:)