问题标签 [market-basket-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
239 浏览

sas - 关联规则中的支持结果小于 5%

我面临着协会规则的问题。我有一个由事务 ID 和 ProductID 组成的数据集,我编辑了变量并将 TransactionID 角色更改为“ID”,将 productID 角色更改为“Target”。最低支持百分比设置为 5%。但是当我运行该协会时,我得到的支持百分比不到 5%。可能有什么问题?

在此处输入图像描述 在此处输入图像描述

0 投票
0 回答
38 浏览

r - 如何从先验算法的输出中提取 UPC?

我有先验算法的输出(包:arules),我想从这个输出中提取 UPC?我该怎么做呢?

生成输出的代码如下:

输出如下:

0 投票
2 回答
2001 浏览

r - 如何将 csv 数据转换为购物篮格式?

我有以下格式的数据:

其中“TxnId”和“Items”是列。我在 R 中导入了文件并运行了以下命令:

当我运行 apriori 命令时,它会引发错误。

也让我知道 R 接受数据的格式。

0 投票
2 回答
6615 浏览

sql - 对订单详情进行购物篮分析

我有一张看起来(缩写)的表格:

我想运行一个查询来计算最常一起出现的项目列表。

在这种情况下,结果将是:

理想情况下,首先展示包含多个商品的订单,然后展示最常订购的单件商品。

谁能提供一个如何构造这个 SQL 的例子?

0 投票
3 回答
259 浏览

r - 将条件应用于 R 中的多个列

我有一个数据集,它以虚拟变量的形式代表每个客户的篮子。

例如:

其中 P1 代表产品 1,依此类推。

本质上,我想运行一个简单的查询,在其中我可以将所有大于 1 的值转换为 1。这样我的数据中只有 1 和 0。我能够使用以下方法完成几行:

是否有应用所有功能?

0 投票
2 回答
107 浏览

r - 将虚拟变量转换为实际值

我一直在研究以下列方式表示的数据集:

我正在尝试将其转换为 R 中虚拟变量不为 0 的行,例如:

我尝试了以下方法:将虚拟变量重新编码为有序因子,但是,我没有得到多个项目。我很高兴生成一个没有任何列名的新事务表。我希望对生成的数据集进行购物篮分析。

谢谢

0 投票
2 回答
13863 浏览

r - 如何为 arules 准备交易数据到购物篮

好的,所以我搜索了很多,想对销售数据运行 arules。我只需要以正确的格式正确获取数据,并使用正确的“因子”或“变量”和篮子形式进行设置。

现在我有订单号的销售数据,然后是里面的项目。每个订单都是唯一的(每个新订单,都会创建一个新的# 并包括零件#),但相同的项目显然可以出现在许多订单中。

目前,我的数据设置如下:

因此,R 不喜欢这种形式,我必须以 arules 和数据分析可以接受的形式获得它。

是的,我将其保存为文本文件并尝试了 .csv 文件,但如果我能获得有关如何在 RStudio 中准备或操作它的分步说明,那就太好了。

我读到它应该是一个篮子的形式,比如..

1 (A, B, G)
2 (R)
3 (A, B)
4 (E)
5 (Y)
6 (A, B, F, V)

如果这不准确,请纠正我。我明白了,但我只需要一步一步的说明,我似乎在任何地方都找不到。我试过使用 dplyr 和 tidyr。我对数据分析有很好的理解,但在 RStudio 上需要更直接的帮助,所以如果我能一步一步地了解这一点,我会进一步理解。

0 投票
0 回答
189 浏览

weka - Weka Apriori RHS

我正在使用 Weka v3.6在Titanic 数据集上使用Apriori算法挖掘关联规则。10 条最佳规则的创建如下:

1. Class=Crew 885 ==> Sex=Male Age=Adult 862 conf:(0.97) < lift:(1.29) 2. Sex=Male Age=Adult 1667 ==> Class=Crew 862 conf:(0.52) < lift:(1.29) 3. Class=Crew 885 ==> Sex=Male 862 conf:(0.97) < lift:(1.24) 4. Sex=Male 1731 ==> Class=Crew 862 conf:(0.5) < lift:(1.24) 5. Sex=Male 1731 ==> Class=Crew Age=Adult 862 conf:(0.5) < lift:(1.24) 6. Class=Crew Age=Adult 885 ==> Sex=Male 862 conf:(0.97) < lift:(1.24) 7. Sex=Male Age=Adult 1667 ==> Survived=No 1329 conf:(0.8) < lift:(1.18) 8. Survived=No 1490 ==> Sex=Male Age=Adult 1329 conf:(0.89) < lift:(1.18) 9. Sex=Male 1731 ==> Age=Adult Survived=No 1329 conf:(0.77) < lift:(1.18) 10. Age=Adult Survived=No 1438 ==> Sex=Male 1329 conf:(0.92) < lift:(1.18)

但是,我希望限制仅包含 RHS 的规则Survived: "No","Yes"。我知道在R中,RHS 可以通过 APappearance-class来实现。是否有可能在 Weka 中实现类似的功能?

0 投票
0 回答
130 浏览

oracle - Oracle Data Miner 中的 Apriori 关联。数据准备

我在数据准备中遇到了在 Data Miner 中使用 Apriori 算法的问题。如果我在一列中有产品,一切都很好,可以说:

所以关联规则可能是:如果键盘然后鼠标。使用一列 Apriori 算法可以正常工作。

当我想使用超过 1 列来描述“产品”时,问题就来了。在 DataMiner Apriori Model Creator 中,我只能为 ItemID 选择一列。

例如:

因此生成的规则可能是 If (DayOfWeek = Monday) AND (PartOfDay=Morning) then (DayOfWeek=X) AND (PartOfDay=Y)

这就是我想要达到的目标。我不知道的一件事是如何制作一个将所有数据更改为一列的视图。

我想用每个可能的选项创建一个新表(对于 DayOfWeek 7 组合,对于 PartOfDay 4 组合 = 28 个选项;只有 2 列),并且该新表的 OptionID 将是我的 ProductName。那么小问题就是将这些值向后映射。

也许有人有其他想法如何让它发挥作用?

甲骨文 12g。数据挖掘器 4.1.2.20。

0 投票
1 回答
251 浏览

r - 如何将关联规则集成到新数据集

我在事务数据集上使用 R 中的 arules 生成了一个规则列表。现在,我有一个新数据集,其中包含客户列表和他们在过去 2 个月购买的产品列表。

我的目标是使用从交易数据中获得的规则向这些客户推荐新的相关产品。但是我找不到一种方法来根据客户的购买自动向客户应用推荐(规则)。

欢迎任何建议。

谢谢。