我刚开始使用hadoop,我需要用它来计算一个非常大的数据集的关联规则。我无法理解如何使用 R Hadoop 和 MapReduce 从数据集关联规则中查找。我有事务矩阵,但是我需要做些什么来使用这个矩阵和 hadoop 执行先验算法?这是用于执行 apriori 的命令(包 arules)
rules <- apriori(incidence.matrix , parameter = list(minlen=2, supp=0.09, conf=0.95))
我需要在reduce函数的map函数中使用它吗?