我在机器学习或集群方面没有太多经验,所以我对如何解决这个问题有点茫然。我感兴趣的数据由 4 列组成,其中一列只是一个 id。其他 3 个包含数值数据,值 >= 0。我需要的聚类实际上非常简单,我可以手动完成,但稍后会变得不太清楚,所以我想从正确的过程开始。我需要 6 个集群,它们取决于 3 列(称为 A、B 和 C),如下所示:
A B C Cluster
---- ---- -------- -------
0 0 0 0
0 0 >0 1
0 >0 <=B 2
0 >0 >B 3
>0 any <=(A+B) 4
>0 any >(A+B) 5
在这个阶段,这些集群将洞察数据,为进一步分析提供信息。
由于我对此很陌生,我还没有充分了解进行聚类的各种算法,所以我真的不知道从哪里开始。任何人都可以建议使用合适的模型,或者我可以研究的一些模型。