我正在研究一个简单的推荐系统,我从使用 R 中的 arules 的先验算法开始。令我惊讶的是,当支持度大于 0.0001 时,我得到了 0 条规则,这对于支持度来说太低了。我发现造成这种情况的原因可能是每笔交易中的重复项目都被删除了。我试图通过将删除重复项设置为 false 来解决此问题:
df = read.transactions("transactions.csv",sep = ',',rm.duplicates = FALSE)
但这没有用,我得到了以下信息
Warning message:
In asMethod(object) : removing duplicated items in transactions
那么有没有办法解决这个问题,或者有没有更好的方法来考虑代码中每个事务中每个项目的数量?python或任何其他语言有更好的选择吗?如果有人可以帮助我解决这个问题,那就太好了。