7

我有很多学生根据他们的分数被一些大学选中的数据。我是机器学习的新手。我能有一些建议吗?如何添加 Azure 机器学习来预测他们可以根据自己的分数获得的大学

4

8 回答 8

7

尝试多类逻辑回归 - 也看看这个https://gallery.cortanaanalytics.com/Experiment/da44bcd5dc2d4e059ebbaf94527d3d5b?fromlegacydomain=1

于 2015-11-18T19:28:33.430 回答
4

除了逻辑回归,正如@neerajkh 建议的那样,我也会尝试 One vs All classifiers。这种方法在多类问题(我假设你有很多输入,即学生的分数)和很多输出(不同的大学)中效果很好。

为了实现一对多算法,我将使用支持向量机(SVM)。它是最强大的算法之一(直到深度学习出现,但这里不需要深度学习)

如果您可以考虑更改框架,我建议使用 python 库。在python中,非常快速地计算您面临的问题非常简单。

于 2015-12-25T09:25:57.747 回答
1

使用随机森林树并将这个 ML 算法提供给 OneVsRestClassifer,它是一个多类分类器

于 2017-06-27T19:29:03.197 回答
0

最小二乘支持向量机 (LSSVM) 是此应用程序的强大算法。访问http://www.esat.kuleuven.be/sista/lssvmlab/了解更多信息。

于 2017-06-07T17:24:13.383 回答
0

你为什么不尝试softmax回归?

用非常简单的术语来说,Softmax 接受一个输入并产生属于你的每个类的输入的概率分布。因此,换句话说,基于一些输入(在这种情况下是成绩),您的模型可以输出代表给定学生必须被每所大学录取的“机会”的概率分布。

于 2016-05-27T04:29:05.817 回答
0

这是非常主观的。仅仅应用任何分类的算法都不是一个好主意。如果不执行探索性数据分析并检查以下内容,您将无法确定是否进行了预测分析,除了缺失值:

  1. 定量和定性变量。
  2. 单变量、双变量和多变量分布。
  3. 与您的响应(大学)变量的变量关系。
  4. 寻找异常值(多变量和单变量)。
  5. 必需的变量转换。
  6. 可以是将 Y 变量分解成块,例如位置,例如候选人是否可以是加利福尼亚或纽约大学的一部分。如果加州有更高的机会,那是什么大学。通过这种方式,您可以捕获线性 + 非线性关系。

对于基础学习者,您可以拟合 Softmax 回归模型或 1 vs all Logistic 回归,这并不重要,CART 用于非线性关系。我还会做 K-nn 和 K-means 来检查数据中的不同组并决定预测学习者。

我希望这是有道理的!

于 2017-06-04T15:11:10.560 回答
0

我知道这是一个旧线程,但我会继续添加我的 2 美分。

我建议添加多类、多标签分类器。这使您可以为学生找到不止一所大学。当然,使用 ANN 更容易做到这一点,但配置起来要困难得多(比如网络的配置;节点/隐藏节点的数量,甚至是激活函数)。

正如@Hoap Humanoid 建议的那样,最简单的方法是使用支持向量分类器。

要执行这些方法中的任何一种,您必须拥有一个多样化的数据集。我不能说您需要试验的数据点数量,但模型的准确性取决于数据点的数量及其多样性。

于 2016-07-08T15:57:28.993 回答
0

与其他发布者关于使用多类分类的建议保持一致,您可以使用人工神经网络 (ANN)/多层感知器来执行此操作。每个输出节点都可以是一所大学,因为您将使用 sigmoid 传递函数(逻辑),所以每个节点的输出可以直接视为该大学接受特定学生的概率(在尝试进行预测时)。

于 2016-04-26T19:00:40.817 回答