我已经用 python 编写了代码来实现 DBSCAN 聚类算法。我的数据集由 14k 个用户组成,每个用户由 10 个特征表示。我无法决定究竟要保留什么作为 Min_samples 和 epsilon 的值作为输入我应该如何决定?相似性度量是欧几里得距离。(因此它变得更加难以决定。)任何指针?
问问题
2311 次
我已经用 python 编写了代码来实现 DBSCAN 聚类算法。我的数据集由 14k 个用户组成,每个用户由 10 个特征表示。我无法决定究竟要保留什么作为 Min_samples 和 epsilon 的值作为输入我应该如何决定?相似性度量是欧几里得距离。(因此它变得更加难以决定。)任何指针?