Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
例如,如果给定一个训练集,其中包含超过 10000 个数据点(训练集的大小)并且没有超过 100000 个的特征和接近 20 的类标签。那么在这种情况下,哪个分类器(决策树、svm、Naive 等方法贝叶斯,神经网络,提升)会给我最准确的分类测试数据的类标签。
如评论中所述,没有一般规则。
但是,由于您有相当多的训练示例和非常多的特征,您可能需要某种鼓励特征稀疏的分类器。我会首先尝试使用 L1 或弹性网络惩罚的 SGD 线性分类器。
另请参阅Andreas Mueller 的算法流程图来尝试: