用于聚类分类数据的最合适的机器学习算法系列是什么?假设我们有以下数据集:
V1 V2 V3 V4
"v1a" "v2b" "v3b" "v4c"
"v1b" "v2f" "v3a" "v4c"
"v1a" "v2e" "v3b" "v4c"
有没有办法以某种方式将它们聚集在一起?我对通过 Apache Mahout 这样做特别感兴趣。任何提示\想法都受到高度赞赏。
用于聚类分类数据的最合适的机器学习算法系列是什么?假设我们有以下数据集:
V1 V2 V3 V4
"v1a" "v2b" "v3b" "v4c"
"v1b" "v2f" "v3a" "v4c"
"v1a" "v2e" "v3b" "v4c"
有没有办法以某种方式将它们聚集在一起?我对通过 Apache Mahout 这样做特别感兴趣。任何提示\想法都受到高度赞赏。