0

我们有一个数据集,其中包含客户到他喜欢的产品的映射

c1->{P1, P2, p5} 
c2->{P3, P5, p4} 
c3->{P5, P2, p3}
....

在此基础上,我们需要为客户推荐产品,

假设对于 cx 客户,我们需要推荐产品,因为我们有 cx 从上述集合中购买的数据,并且我们运行 apriori 来找出推荐,但是对于大数据集,它非常慢?

有人可以给我们一些建议来解决这个问题吗?

4

1 回答 1

0

我假设商家销售的商品是您的训练数据,然后随机商品是您的测试数据。因此,最有可能出售的物品将取决于商家当前出售的物品的“特征”。“功能”是指商品的价格、类别,这些是您将拥有的详细信息。然后决定算法,我建议你看一下特征空间。如果有小集群,那么即使是最近邻搜索也会更好。如果分布很复杂,那么您可以选择 SVM。有各种数据可视化技术。采用 PCA 并可视化前两个维度可能是一个不错的选择。

于 2013-03-01T18:15:21.820 回答