6

我们知道有上千个分类器,最近有人告诉我,有人说adaboost就像脱壳的分类器。

  • 有没有更好的算法(有那个投票的想法)
  • 分类器的最新技术是什么。你有一个例子吗?
4

5 回答 5

6

首先,adaboost 是一种元算法,可与您最喜欢的分类器结合使用(在其之上)。其次,在一个问题域中运行良好的分类器通常在另一个问题域中运行不佳。请参阅无免费午餐维基百科页面。因此,您的问题不会有答案。尽管如此,了解人们在实践中使用什么可能会很有趣。

于 2011-02-27T07:26:40.933 回答
3

Weka 和 Mahout 不是算法……它们是机器学习库。它们包括各种算法的实现。因此,您最好的选择是选择一个库并尝试几种不同的算法,看看哪种算法最适合您的特定问题(其中“效果最佳”将是训练成本、分类成本和分类准确性的函数)。

如果是我,我会从朴素贝叶斯、k-最近邻和支持向量机开始。它们代表了成熟的、易于理解的方法,但权衡非常不同。朴素贝叶斯很便宜,但不是特别准确。K-NN 在训练过程中很便宜,但在分类过程中(可能)很昂贵,虽然它通常非常准确,但很容易受到过度训练的影响。SVM 的训练成本很高,并且有很多元参数需要调整,但它们的应用成本很低,而且通常至少与 k-NN 一样准确。

如果您告诉我们更多有关您要解决的问题的信息,我们或许能够提供更有针对性的建议。但是,如果您只是在寻找一种真正的算法,那么没有一种——没有免费午餐定理保证了这一点。

于 2011-03-10T19:51:45.303 回答
2

Apache Mahout(开源,java)似乎获得了很大的动力。

于 2011-02-28T07:58:20.840 回答
2

Weka是一个非常流行且稳定的机器学习库。它已经存在了很长一段时间,并以Java.

于 2011-02-28T08:01:32.390 回答
1

哈斯蒂等人。(2013, The Elements of Statistical Learning) 得出结论,梯度提升机是最好的“现成”方法。与您遇到的问题无关。定义(参见第 352 页):“现成”方法是一种可以直接应用于数据的方法,无需大量耗时的数据预处理或仔细调整学习过程。

还有一点旧的含义:事实上,Breiman (NIPS Workshop, 1996) 将带有树的 AdaBoost 称为“世界上最好的现成分类器”(另见 Breiman (1998))。

于 2016-04-16T17:57:16.130 回答