问题标签 [market-basket-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
353 浏览

r - 使用分类变量的购物篮分析

嗨,我只有购买日期、价格、销售以及类别和品牌等变量。我需要对品牌=“a”和品牌=“b”进行市场篮分析,面食类别分开。

我已经完成了面包、黄油、牛奶等所有项目的 mba。然而,这很棘手。我已经研究并知道我们需要离散化 R. 中的数值变量。不知道这是否是进行篮子分析的正确数据。任何人都可以快速分享您的更新。想想excel表格中的数据。

.

0 投票
0 回答
47 浏览

powerpivot - Powerpivot 中的购物篮分析 - 两种产品收入的总和

我想计算在一个订单中销售的两种产品的收入(产品 A 和 B)的总和,而我可用的指导是关于计算仅product b附加到的收入product A。我目前使用的公式是:

0 投票
1 回答
221 浏览

r - R中篮子分析的准备数据集

我目前正在使用食品大厅数据集,并想分析篮子。但是,我有以下问题:

这是我的数据的摘录:

为了能够实际分析消费者进行的购买,我需要从数据集中删除所有取消。不幸的是,我不能只删除包含“CANCEL”的项目,因为这会扭曲我的结果,因为我需要删除已取消的项目以及被取消的项目。例如篮子号。7876含有水、健怡可乐、CANCEL健怡可乐和寿司。但最终消费者只买了水和寿司。我需要的是一个函数,它可以识别取消和被取消的项目并将其删除,以便我得到一个如下所示的数据集:

这样实际的购物篮 7876 只包含消费者最终购买的物品。感谢您的任何帮助或建议!

0 投票
2 回答
940 浏览

sequence - 如何为序列项目训练 LSTM 模型?

我尝试将 LSTM 模型用于下一个购物篮推荐。我想应用与本文相同的方法:A Dynamic Recurrent Model for Next Basket Recommendation

就我而言,我有一些用户,他们在不同的时间购买了一些商品。所以我设计了我的 X 数据,如:

序列项表示形状为 (1,20) 的数组。这些向量是在每个序列期间购买的每个项目(使用 word2vec 生成)的平均表示。

然后我设计我的标签 y 喜欢:

标签 user 代表每个用户的下一个订单,在他们过去的订单之后,在 X 数据中表示。此外,标签是类似 [1 0 1 0 0 0 .. 1 ] 的向量,其中 1 表示用户购买了该商品,否则为 0。

所以,我想使用 LSTM 来训练每个用户过去的序列来预测下一个购买序列。下面,我定义了一个 LSTM 模型,我不返回序列,因为我有一个用户标签。

如您所见,我使用 batch_size = 1 训练我的 LSTM,因为用户之间的时间步长不同。我在 70% 的用户上拟合了模型,并在其余的用户上测试了模型。

我的结果很差,模型为每个用户测试推荐的 top-n 项非常相似。例如,对于特定用户,该模型会推荐从未出现在其旧序列中的项目。虽然通常情况下,它必须预测最后一个序列比较的项目,因此,它应该预测过去购买的项目的高概率。

显然,我的方法似乎是错误的。也许设计和训练数据不适合我的目标。您有什么想法或建议来拟合数据以达到我的目标吗?

注意:当我拟合一个只有一个用户的 LSTM 模型时,每次都有他的序列和他的标签(代表每个时间序列的下一个订单),我得到了很好的结果来预测最后一个用户订单的下一个订单。但是这种方法,迫使我训练 N-user LSTM 模型,所以是不对的。

谢谢,

0 投票
1 回答
928 浏览

associations - WEKA FP-growth 关联规则未找到规则

对于报告,我必须找到交易数据集的关联规则。我下载了这个数据集: http: //archive.ics.uci.edu/ml/datasets/online+retail

然后我删除了一些列,转换为标称值并标准化,然后

我得到了这个:https ://ufile.io/gz3do

所以我认为我有一个数据集,其中包含可以使用 FP-growth 和 Apriori 的交易,但我没有得到任何规则。

它只是告诉我:没有找到规则!

有人可以向我解释一下我做错了什么吗?

0 投票
1 回答
1520 浏览

python-3.x - 使用 Python 的关联规则与句子形式的数据

我想使用 Python从数据集中的文本字段计算关联规则,例如下面的数据集:

请注意,这Orange 2.7不是一个选项,因为我使用的是当前版本的 Python(3.6),Orange 3公平游戏也是如此;但是,我似乎无法弄清楚这个模块如何处理这种格式的数据。

在我看来,第一步是将上述转换为稀疏矩阵,例如下面显示的(截断的)矩阵:

在此处输入图像描述

接下来,我们要删除停用词(即 I、to、and、for 等)、大写/小写问题、数字、标点符号,以及诸如土豆、土豆、土豆等词的解释(带有词形还原) .

一旦这个稀疏矩阵就位,下一步就是计算稀疏矩阵中所有单词/字符串之间的关联规则。我已经使用arules包在 R 中完成了此操作;但是,我无法确定Pythonarules的“等价物” 。

我设想的最终解决方案将包括左侧和右侧参数的列表,以及按降序排列的规则的支持度、置信度和提升度,最高提升度规则在顶部,最低提升度规则在底部(再次,很容易在 R 中获得arules)。

此外,我希望能够将右侧指定为“培根”,这也以降序显示规则的支持、信心和提升,关于“培根”的最高提升规则在顶部以及与底部“培根”相关的最低提升规则。

使用Orange3-Associate可能是去这里的路线;但是,我在网上找不到任何好的例子。提前感谢您的帮助!

0 投票
1 回答
70 浏览

r - 市场篮子分析 - 可变数量特征的单一模型?

我正在使用 Apriori 构建一个推荐系统来配合我公司的应用程序。在走这条路之前,我想与有更多经验的人确认我走在正确的轨道上。任何帮助表示赞赏。

让我试着解释一下这个问题。根据应用程序中用户的上下文,影响推荐的功能可能会有所不同。例如,想象一个购物场景。如果我在 HEB 购物,我通常有一个预定义的购物清单,所以如果我只是告诉应用程序我要去 HEB,那么该清单上的商品将是很好的推荐。不过,当我去家得宝时,我倾向于按部门购物,所以如果我告诉应用程序我在家得宝并且我正在购买电动工具,那么电动工具和相关部件是很好的推荐。

您会看到,在这两种情况下,功能的数量会有所不同。第一,我的推荐完全取决于商店,而第二,它们取决于商店和我购物的部门。

我希望使用可以处理这种情况的单个 Apriori 模型。这会被认为是一种最佳实践,还是有不同的模型更好,一个用于我们只列出商店的时候,另一个用于我们列出商店和部门的时候?鉴于 Apriori 是一种无监督算法,我认为它可以用一个模型来完成,但由于我没有大量经验,所以想仔细检查一下。

0 投票
1 回答
296 浏览

r - 使用来自数据的 Arules 和 ArulesViz 的关联规则

我有一个带有 customer_id 和 product_name 的 R 数据框。一个客户可以拥有多个产品。在客户列中,由于他们拥有多个产品,因此存在重复的 customer_id。

我正在尝试进行基本的先验分析并确定一起购买的产品的一些关联规则。我想使用 R 中的 Arules 和 ArulesViz 包来执行此操作。

当我尝试运行它时,我通常会得到 0 个规则或 lhs 产品 --> rhs customer_id。所以我不相信我正在正确加载数据以查看多个产品给单个客户以得出关联。

任何帮助,将不胜感激!

基本数据框示例

0 投票
1 回答
555 浏览

r - arules 子集在 arules 包的新版本 (1.5-2) 中不起作用

我最近由 Arules 包更新到版本 1.5-2,因为我无法从规则集中子集项目列表,所以当我尝试子集“结构错误(seq(长度(标签)),名称时出现以下错误=标签)[i]:无效的下标类型'S4'”这里是一个例子

提前致谢

0 投票
1 回答
114 浏览

python - 关联规则与购物车比较

以下是先验的一些简单代码

下面是数据集

规则的输出看起来像

什么是查看产品购物车的正确有效方法,它是一个逗号分隔的字符串,如 [p1,p2] 并推荐接下来的 2 个最佳产品。

上面的代码不能处理所有条件..