0

例如,如果给定一个训练集,其中包含超过 10000 个数据点(训练集的大小)并且没有超过 100000 个的特征和接近 20 的类标签。那么在这种情况下,哪个分类器(决策树、svm、Naive 等方法贝叶斯,神经网络,提升)会给我最准确的分类测试数据的类标签。

4

1 回答 1

5

如评论中所述,没有一般规则。

但是,由于您有相当多的训练示例和非常多的特征,您可能需要某种鼓励特征稀疏的分类器。我会首先尝试使用 L1 或弹性网络惩罚的 SGD 线性分类器。

另请参阅Andreas Mueller 的算法流程图来尝试

于 2013-02-06T07:50:19.007 回答