3

我正在通过 apache mahout 运行朴素贝叶斯分类器算法。我们可以选择在训练和运行算法实例时设置 gram 大小。

将我的 n-Gram 大小从 1 更改为 2,会极大地改变结果分类。为什么会这样?n-Grams 大小如何使结果发生巨大变化?

4

1 回答 1

6

1-gram 是单词。2-grams(或bigrams)是成对的词。这就像根据“United”和“States”或“United States”的存在对文档进行分类。使用二元组可能会对空间和性能产生一些影响,但可能会比 1 元组提供更好的结果。

于 2011-12-20T12:16:13.233 回答