2

我正在实现用于比较 java 中的两个文本文件的工具。文本文件仅包含数字、字母数字和键盘符号。将一个文件与另一个文件进行比较,找出拼写、标点或缺失文本错误。

例子:

Original word: Her
 Error Word: hor   
It is spelling error

Original word: Miss
 Error Word: miss 
It is Punctuation error 

无需使用字典,因为拼写也与原始文件进行比较。如果原始文件中的单词是她,而第二个文件中的单词是 hor,则会产生拼写错误,但问题是拼写、标点符号或缺失文本的分类做得不好

如果有任何功能或工具可以解决我的问题,请建议我。

4

2 回答 2

0

您需要实现一个字典Trie 数据结构。这是进行拼写更正的唯一方法,结果可预测。

于 2012-10-08T08:15:55.410 回答
0

由于我无法在原始帖子下发表评论,因此我将在此处要求澄清。

问题是“如何判断一个单词是否丢失”?例如,如果您有以下行:

“我的名字是罗伊,这里有一堆其他的文字”

“我的名字罗伊,这是一堆其他的文字”

因为第二行少了“is”这个词,程序就报一堆拼写错误而不是漏词错误?

于 2012-10-08T08:27:48.393 回答