0

我不知道我应该如何解决这个问题:

我有一个数据集。用户可能是也可能不是受资助计划的一部分。我想使用机器学习来推断不属于该计划的用户容易受到某些条件的影响,例如 1,2,3 和 4。计划中的用户容易受到 1,2 和 4 的影响。因此可以推断出如果您是该计划的一部分,您将不会受到条件 3 的影响。

我还有第二个相关问题。在资助计划中,用户可以有两个计划(费用不同)。我想看看那些参加更便宜计划的人是否比参加更昂贵计划的人更容易受到更多条件的影响。

任何人都可以帮助我了解这是推荐问题还是分类问题以及我应该查看哪些特定算法?

谢谢。

4

2 回答 2

1

两者都不。这是一个统计问题。您的数据集是完整的,并且您没有提到任何需要预测未来主题或方案的属性,因此训练分类器或推荐器似乎无法满足其通常的目标。

您可以使用一个人的条件作为特征,将他们的方案统计作为目标,使用 SVM 对它们进行分类,然后使用分类性能/准确度作为类可分离性的衡量标准。你也可以考虑集群。然而,t 检验会做同样的事情,并且是一个更被接受的工具来证明这样的声明的有效性。

于 2012-05-19T20:44:49.397 回答
0

看起来您正在尝试构建一个系统,将用户分类为已资助或未资助,如果未资助,则说明他们未资助的原因。

如果是这种情况,您需要的是一个可解释的机器学习分类器,即可以将分类器做出某个决定的原因传达给用户。您可能想查看决策树和(在较小程度上)RandomForest 和 Gradient Boosted Trees。

于 2017-07-20T13:53:07.020 回答