-2

我正在做一个使用数据集的项目 - https://www.kaggle.com/aljarah/xAPI-Edu-Data 。我想根据数据集的各种属性(例如举手、访问的资源、查看的公告等)对学生进行聚类(每个学生表示为索引)。请建议我如何使用 DBSCAN 实现这一点,如果没有,请提出一些技术通过它我可以做到。我是这个数据科学领域的新手。

谢谢

我尝试学习 gmm 和 dbscan。

我想对数据集进行聚类。

4

1 回答 1

0

DBSCAN 的任何标准实现都将支持多个属性。

大多数情况下,当属性具有非常不同的类型时,这将取决于如何衡量相似性的决定。欧几里得距离可能没有意义。但是没有“正确”的方式来做这些,如何对数据建模是你的决定。不幸的是,在这个数据集上,这将是相当随意的,因为这些属性没有自然尺度。

于 2019-03-31T10:44:57.060 回答