0

我是数据科学的新手,我对 k-means(或任何)聚类算法有一个更理论的问题。目前我正在尝试根据行为数据进行客户细分。我们设计了几个属性,例如: - 客户购买销售产品的百分比, - 每次平均产品数量 - 每个产品的平均价格 - 在商店购买产品的频率 - 以及其他几个。

我们试图完成的是一群行为相似的客户,因此我们可以根据他们的喜好与他们进行交流。问题是我不确定聚类的结果是否为我们提供了我们可以使用的正确细分。可能它会确定其他有利于类似行为的集群,但不适用于实际使用。

我的问题如下;使用分类器算法会更好,这样我就可以确定目标变量,还是应该使用聚类算法?如果我必须选择一个聚类算法,减少属性的数量会更好吗,这样我就可以更好地控制结果的走向?

我希望你们能帮助我解决这个概念问题。

4

1 回答 1

0

如果您可以使用分类,那么请始终使用分类。

聚类是脆弱的,不是一个非常明确的问题。您不想在集群算法上建立业务。

于 2017-02-13T19:21:10.293 回答