R 中的 arules 包使用“事务”类。因此,为了使用该功能apriori()
,我需要转换我现有的数据。我有一个 2 列和大约 1.6 毫米行的矩阵,并尝试像这样转换数据:
transaction_data <- as(split(original_data[,"id"], original_data[,"type"]), "transactions")
其中 original_data 是我的数据矩阵。由于数据量大,我使用了最大的 AWS Amazon 机器,64gb RAM。过了一会儿我得到
结果向量超出了“AnswerType”中的向量长度限制
机器的内存使用率仍然“仅”为 60%。这是基于 R 的限制吗?除了使用采样之外,还有什么方法可以解决这个问题?当仅使用 1/4 的数据时,转换工作正常。
编辑:正如所指出的,其中一个变量是一个因素而不是性格。更改后的转换得到了快速和正确的处理。