我想建立一个预测模型,根据学生的年龄、性别和家庭收入来预测学生的辍学率。我是机器学习的初学者,需要帮助。请让我知道如何进行此操作?
问问题
445 次
1 回答
0
您所描述的本质上是流失预测。
在开始考虑构建预测模型之前,您需要确保拥有大量标记数据。在您的情况下,无论学生是否辍学,您都必须有许多记录,其中学生标有 Y/N (0/1)。
Student ID, Age, Gender, Family Income, Dropped Out
1, 15, M, 10000, Y
2, 16, F, 20000, N
3, 14, M, 13000, Y
..
10000, 15, M, 30000, N
如果您确实有这样的数据,您可以继续并开始构建您的模型。
这是一篇博文,解释了使用 Scikit-Learn 构建模型的一般过程,这里是另一篇博文,了解有关使用一些 python 代码进行流失预测的更多详细信息。
于 2019-02-09T19:03:51.043 回答