1

我在机器学习或集群方面没有太多经验,所以我对如何解决这个问题有点茫然。我感兴趣的数据由 4 列组成,其中一列只是一个 id。其他 3 个包含数值数据,值 >= 0。我需要的聚类实际上非常简单,我可以手动完成,但稍后会变得不太清楚,所以我想从正确的过程开始。我需要 6 个集群,它们取决于 3 列(称为 A、B 和 C),如下所示:

A    B    C        Cluster
---- ---- -------- -------
0    0    0        0
0    0    >0       1
0    >0   <=B      2
0    >0   >B       3
>0   any  <=(A+B)  4
>0   any  >(A+B)   5

在这个阶段,这些集群将洞察数据,为进一步分析提供信息。

由于我对此很陌生,我还没有充分了解进行聚类的各种算法,所以我真的不知道从哪里开始。任何人都可以建议使用合适的模型,或者我可以研究的一些模型。

4

2 回答 2

2

这对我来说看起来不像集群

相反,我认为您需要一个简单的决策树分类

它应该已经在 Rapidminer 中可用。

于 2012-10-24T15:52:11.613 回答
0

您可以使用“生成属性”运算符。

这会从现有属性创建新属性。

创建所有规则会相对令人厌烦,但它们会像

集群:如果 (((A==0)&&(B==0)&&(C==0)),1,0)

于 2012-10-25T20:15:04.183 回答