Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个带有 BINARY 用户/项目特征矩阵的大型数据集:
不,用户和项目的聚类是单独的过程。虽然在精神上它是完全相同的过程,只是应用了两种不同的方式。
如果您想在 Mahout 中获得更具体的答案,则必须详细说明您正在使用的代码的哪些部分,因为有几个不同的部分涉及集群。
项目中有一些凝聚聚类部分,适用于任何相似性度量。我知道的其他实现肯定是“k-means”种类,假设一个连续的向量空间而不是超过 {0,1} 的向量。我认为你需要一种 k-medoids 算法,而这不在我所知道的项目中。