我是聚类的初学者,我有一个二进制矩阵,每个学生都有他们注册的课程。我想用相同的课程对学生进行聚类。
聚类方法很多,并且根据数据集而变化
例如,k-means 是不合适的,因为数据是二进制的,标准的“均值”操作对二进制没有多大意义。
我愿意接受任何建议
这是一个例子:
+------------+---------+--------+--------+
| session1 | session2|session3|session4|
+------------+---------+--------+--------+
| 1 | 0 | 1 | 0 |
| 0 | 1 | 0 | 1 |
| 1 | 0 | 1 | 0 |
| 0 | 1 | 0 | 1 |
+------------+---------+--------+--------+
结果:
集群A = [用户1,用户3]
集群B = [用户2,用户4]