-1

我有 100 万行是这样的:

customer_id product_id_viewed 12345 [756436, 369955, 1244356, 4689667]

我想根据客户查看模式的聚合将通常一起查看的产品聚类到单独的集群中。我怎么做?

我采取的另一个步骤是将此数据加载到 Elasticsearch 中,并使用我的每个 product_ids 对客户视图执行显着_terms 查询。然后,我为最有可能一起查看的每个产品返回 10 个产品,以及一个分数。我的最终愿望是能够以描述不同“个性”类型或兴趣的方式对这些产品数据进行聚类。

像neo4j这样的图形数据库可以在这里提供帮助还是其他一些聚类算法?

4

1 回答 1

0

聚类是错误的方法。

没有理由假设这些模式是不相交的,并且完全分开是合适的。

而是进行市场篮子分析,即频繁项集挖掘

于 2019-02-06T14:02:24.240 回答