1

训练文档的数量对分类时间有影响吗?对于 K-nn,我知道 K-nn 中的所有计算都是在分类中进行的,而在训练中没有或只做最少的工作。支持向量机、朴素贝叶斯、决策树等是否也是如此?

4

1 回答 1

2

只有惰性分类器才有这样的特点,KNN就是其中之一。

  • SVM - 分类时间取决于支持向量的数量,这可能但不一定 - 取决于训练文档的数量(它们是 SV 数量的上限)
  • 朴素贝叶斯 - 没有影响,除非这些新文档携带很多新词,因为 NB 分类时间是 O( 特征数 ),所以如果你不扩大词汇量(在 BOW 模型的情况下)你可以安全使用大量训练数据
  • 决策树 - 与 NB 相同,它仅取决于特征的数量(以及问题的复杂性,不随实例数量而变化)
  • 神经网络——这里的分类时间只取决于神经元的数量
于 2014-01-13T09:22:40.613 回答