0

我正在研究一个简单的推荐系统,我从使用 R 中的 arules 的先验算法开始。令我惊讶的是,当支持度大于 0.0001 时,我得到了 0 条规则,这对于支持度来说太低了。我发现造成这种情况的原因可能是每笔交易中的重复项目都被删除了。我试图通过将删除重复项设置为 false 来解决此问题:

df = read.transactions("transactions.csv",sep = ',',rm.duplicates = FALSE)

但这没有用,我得到了以下信息

Warning message:
 In asMethod(object) : removing duplicated items in transactions  

那么有没有办法解决这个问题,或者有没有更好的方法来考虑代码中每个事务中每个项目的数量?python或任何其他语言有更好的选择吗?如果有人可以帮助我解决这个问题,那就太好了。

4

1 回答 1

0

支持基于事务的数量。

因此,根据定义,项目的数量与支持无关。

您的问题可能是您没有足够好地预处理数据。对于关联规则,似乎通常需要使用产品而不是单个产品代码。即用“啤酒”和“牛奶”而不是“Wilmaukee 最差的 12 盎司罐装 24 包”和“FUGGIES UnderNites 尿布,4 号,56 克拉,大包”来查找规则。合并这种过度分化的产品可以改善支持。

于 2018-05-10T12:33:08.010 回答