4

我已经为僧伽罗语(斯里兰卡语言)建立了光学字符识别。我在某种程度上取得了成功。现在我需要做的是使用字典数据进行后处理。

将拼写错误的单词变成正确单词的最佳方法是什么?任何人都可以提供建议吗?

我有 unicode 格式的字典数据文件,我的 OCR 输出也是一个 unicode 文件。我正在使用 C++ 执行此操作。到目前为止,我已经尝试过字符串匹配算法,但没有成功。我想开始解决这个问题的最相关的方法。任何人都可以帮助我吗?

提前致谢。

4

0 回答 0