4

我即将开始一个班级的 ML 项目,我想为教育做一个“推荐系统”之类的东西(即一个说明学生下一步应该做什么的系统)

进一步阐述:构建(某种)可以预测学生准确性的系统并尝试推荐可能提高准确性的内容(例如,数学问题)会很有趣。

现在,我还没有一个确定的项目。我现在没有办法收集数据,所以我想看看可用的数据来详细说明这个项目。任何与教育有关的数据集都可能有用(和/或鼓舞人心)

我在堆栈溢出中发现了一些用于训练 ML 的有趣数据集: Netflix Prize Dataset to be analyze with Collaborative Filtering (CF) algorithms , Dataset for data mining project但不幸的是,据我所知,与教育无关

4

3 回答 3

3

UCI是机器学习数据集的重要来源

有一个公开可用的助教评估数据集,可以满足您的需求:

http://archive.ics.uci.edu/ml/datasets/Teaching+Assistant+Evaluation

收藏家

Wei-Yin Loh(统计系,威斯康星大学麦迪逊分校)

捐助者

Tjen-Sien Lim (limt '@' stat.wisc.edu)

数据集信息

这些数据包括对威斯康星大学麦迪逊分校统计系的 151 名助教 (TA) 作业的三个常规学期和两个夏季学期的教学绩效评估。分数被分为 3 个大致相等的类别(“低”、“中”和“高”)以形成类变量。

属性信息

  1. 助教是否以英语为母语(二进制);1=会说英语的人,2=不会说英语的人
  2. 课程讲师(分类,25个类别)
  3. 课程(分类,26个类别)
  4. 夏季或常规学期(二进制) 1=夏季,2=常规
  5. 班级规模(数字)
  6. 类属性(分类) 1=低,2=中,3=高
于 2013-08-20T14:30:57.630 回答
0

我的选择原来是https://pslcdatashop.web.cmu.edu/(一个专门研究教育环境数据的网站)

特别是,他们在 2010 年举办了 KDD 杯,挑战是根据以前的表现预测学生的准确性:https ://pslcdatashop.web.cmu.edu/KDDCup/rules_evaluation.jsp

这是一个相当大的数据集,您还可以看到参与人员的论文(这非常有用!)

于 2013-11-27T00:28:20.290 回答
0

在我们上的机器学习课上,我们与 CONLL 中的共享任务进行了竞争。有许多不同类型的学习集可用,我们组成团队相互竞争。

另一个寻找数据集的地方是 kaggle ( http://www.kaggle.com/competitions )。有不同类型的数据集,它们也很有趣。

于 2013-08-30T03:19:06.620 回答