-2

我想知道我可以做实验的算法列表,以根据一组输入预测患者患癌症或发烧的概率……请假设我有数百万的数据,所以我想尝试最好的算法预测......我对数据挖掘和机器学习真的很陌生......

4

4 回答 4

3

目前最流行的预测和分类算法之一是Leo Breiman 的随机森林 (RF)。它的实现也可以在 weka 中使用。

于 2012-08-14T19:02:59.140 回答
2

这个问题有点模糊,我只能给出一个模糊的答案:使用全能的SVM!向 SVM 分类器提供数百万个输入向量,它应该能够在之后为您提供最先进的预测。

如果您正在寻找 SVM 的实现,请查看libsvm,它在几乎所有体面的编程语言中都有包装器。

于 2011-06-13T22:42:31.990 回答
2

如果您专门研究估计某事的概率,那么您需要使用生成概率的机器学习方法。大多数只生成一个类标签:是/否。

用于估计概率的最著名的算法是逻辑回归。Weka中提供了一个实现。

于 2011-06-14T12:03:42.560 回答
0

开始使用大量机器学习库进行实验的最流行工具是Weka。在这里,您可以上传您的数据并尝试多种算法。它的弱点是可扩展性,但处理数据不是问题。

于 2011-06-14T07:42:27.537 回答