-1

我目前正在做文本分类,发现语料库中的一些文档有拼写错误,比如“goes”写成“geos”,“available”写成“avaliable”。我是 524 智能停用词来删除停用词。这种拼写错误导致停用词无法从语料库中正确删除并存在于其中,这可能会影响我的分类器性能。我正在使用 20 News Group 数据集。

我应该用什么来纠正 Java 中的英语拼写?

4

1 回答 1

1

请参考这个你可能会得到一个想法 http://code.google.com/p/google-api-spelling-java/

于 2014-01-29T12:48:18.337 回答