问题标签 [market-basket-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
out-of-memory - Rapidminer 数值到二项式 - RAM 问题
对于 Rapidminer,我有一个包含 3 列(交易 ID、产品描述、价值)和大约 100 万行的数据集。
我正在尝试应用 FP-Growth 和 Create Association,但是由于在我的过程的“数值到二项式”阶段的记忆,这一直失败。我已经分配了 56GB 的 RAM。
“此过程将需要超过最大可用内存量。您可以离开......” 附加示例
我在这里做错了吗?我原以为 56GB 的 RAM 足以应付这个问题。
任何帮助都感激不尽
谢谢。
rapidminer - 如何在 RapidMiner 中为关联规则加载交易(篮子)数据?
我有项目集格式的逗号分隔交易(篮子)数据
其中每一行表示在单个交易中购买的物品。通过使用 Read.CSV 运算符,我在 RapidMiner 中加载了这个文件。我找不到任何运算符来转换此数据以进行 FP 增长和关联规则挖掘。
有没有办法在 RapidMiner 中读取此类文件进行关联规则挖掘?
r - 每个产品的数量大小的规则
我想使用 r 的 arules 包进行购物篮分析。
问题是我没有每笔交易的数据。我的数据每天都会汇总。所以我正在考虑比较每种产品的销售数量。
我如何输入这个数量的销售量并使用 arules 包?
scala - 使用 Spark FP-Growth 进行篮子分析
嗨,
我正在尝试使用 FP-Growth 算法使用 Spark 构建推荐篮分析
我有这些交易
现在我想要“经常项目”
最后我使用关联规则来获取“规则”
到目前为止一切都还好,但是接下来我想为每笔交易提供建议……有什么简单的方法可以做到吗?因为我的scala很糟糕
在 RI 做这样的事情
谢谢你的时间
r - 使用 R 将事务类型数据表替换为来自不同表的项目编号
首先我们有一个交易数据,我们可以使用内置的数据集。
输出是:
但是我们有另一个数据表,我们想要将数据用于标签:
如何用第二个表中的 itemnum 替换第一个表上的产品描述?
所以当我运行时:
输出是:
r - 如何使用 R arules 包在操作上提出建议?
我已经使用 R arules 库成功生成了关联规则。
我现在想做的是相当于 DMX 中的预测连接。我想拿一件物品,并取回前 5 件相关物品。
我在 arules 库中看到了 predict 方法,但文档并未表明它用于这种类型的预测。
更进一步,我如何重用我在某种脚本中创建的规则?每次我想生成相关项目时,我是否应该将它们导出到文件并直接导入它们?
我来自 Microsoft Data Mining 世界,模型在服务器上持续存在。我什至不确定我要问的是否是使用 R 的适当方法。感谢您的任何指导。
pmml - 在 KNIME 中将关联规则导出到 PMML
我已经在 KNIME 中构建了关联规则分析,现在我想将这些规则导出到 PMML 以便在 KNIME 之外进一步使用。
是否可以在 KNIME 中将关联规则导出到 PMML?
任何帮助都会很棒!
csv - Weka 禁用了关联规则生成的“开始”按钮
我正在使用Weka explorer
aka 生成关联规则Market Basket Analysis
。我有我的数据在一个csv
文件中。首先,我有大约 200,000 条记录,csv
文件中有 59 个变量,运行了 3 个多小时,我仍然没有得到结果。
结果,我试图删除大部分记录,文件中只留下了 5,000 条记录。现在,当我尝试运行相同的关联规则时,该Start
按钮被禁用。
有没有其他人遇到过类似的问题?任何人的任何建议?
r - 在 R 中运行 apriori 不会产生任何规则。
我试图在我的数据集上运行 apriori 但没有得到任何规则。这是我所看到的。
先感谢您。
r - 重新排列 R 中的数据以进行购物篮分析
我有 csv 格式的数据。
数据格式如下。收据编号在一栏中,产品在相应栏中
我想将它们重新排列为
即收据编号和产品名称在一行中,以逗号分隔。由于数据很大,我想在 R 中重新排列相同的数据。
请帮助
谢谢。
问候, Nithish