问题标签 [market-basket-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 为什么先验告诉我尝试应用非功能
我正在尝试使用 package.json 进行市场篮子分析arules
。但是,我在使用apriori
算法的时候,R
报了如下信息。
先验的
参数规格:
print.default(参数)中的错误:尝试应用非功能
我查看了我的交易数据结构和 apriori 的功能。似乎没有什么不妥。请希望有人以前遇到过类似的问题并可以帮助我。
谢谢
我的dt和dt2的结构更新如下
python - Python中的购物篮和聚类
我有一个DataFrame
看起来像这样的大熊猫:
现在,我想找出所有商品一起订购的商品和流行的捆绑商品。
r - 对于大型数据集,如何在 R 中使用先验算法?
我一直在研究市场篮子分析,通过 R 中的先验方法,数据包含 12 个变量和 21,00,000 个观察值,我的笔记本电脑有 4 GB RAM,我的 R 代码没有运行以将数据转换为交易。请帮忙。
r - 在购物篮分析中,我有什么办法只能在关联规则的 lhs 中获得 1 项?
在 aprioi 算法中,我得到以下结果,但是,我只想要 lhs 中的 1 个项目,如观察 108 所示,有什么方法可以做到吗?
r - Apriori 算法:我在交易中做错了什么
我正在尝试在我拥有的数据集上运行 Apriori 算法
这是我正在运行的代码
当我尝试创建transaction
对象变量名称时:transaction_prior
我收到以下错误:
我也尝试discretize
了方法,而不是使用summarise
来自 dplyr 的方法,但是我的先验不会给出任何结果,要么需要很长时间,要么返回 0 规则。
谁能向我解释我哪里出错了?
这是data
变量中存在的数据:
kable(头(数据,25))
这是变量的dput
转储:data
输入(头(数据,5))
结构(列表(订单 ID = 2:6,篮子 = 列表(结构(c(42L,54L,123L,90L,7L,54L,40L,125L,99L),.Label = c(“空气清新剂蜡烛”,“亚洲食品”、“婴儿配饰”、“婴儿沐浴身体护理”、“婴儿食品配方”、“烘焙甜点”、“烘焙原料”、“烘焙用品装饰”、“美容”、“啤酒冷却器”、“润肤露香皂” ”、“面包”、“早餐面包店”、“早餐棒糕点”、“散装干果蔬菜”、“散装谷物米干货”、“面包卷”、“黄油”、“糖果巧克力”、“罐装水果苹果酱” ", "罐装蔬菜罐头", "罐头豆类", "罐头肉类海鲜", "猫粮护理”、“谷物”、“脆饼干”、“清洁产品”、“可可饮料混合物”、“咖啡”、“感冒过敏”、“调味品”、“饼干蛋糕”、“饼干”、“奶油” ”,“除臭剂”,“尿布湿巾”,“消化”,“餐具清洁剂”,“狗粮护理”,“面团明胶烘焙混合物”,“干意大利面”,“鸡蛋”,“能量燕麦棒”,“能量运动饮料”、“眼耳护理”、“面部护理”、“女性护理”、“急救”、“食物储藏”、“新鲜蘸酱”、“新鲜水果”、“新鲜香草”、“新鲜意大利面” , “新鲜蔬菜”, ”冷冻开胃菜”、“冷冻面包面团”、“冷冻早餐”、“冷冻甜点”、“冷冻果汁”、“冷冻餐”、“冷冻肉类海鲜”、“冷冻比萨”、“冷冻农产品”、“冷冻素食”素食”、“水果蔬菜零食”、“谷物米干”、“格兰诺拉麦片”、“护发”、“蜂蜜糖浆花蜜”、“热麦片煎饼混合物”、“热狗培根香肠”、“冰淇淋冰” ,“冰淇淋配料”,“印度食品”,“速食食品”,“果汁花蜜”,“厨房用品”,“犹太食品”,“拉丁食品”,“洗衣店”,“午餐肉”,“腌肉制品” ",“肉类柜台”,“牛奶”,“薄荷口香糖”,“失踪”,“更多家庭”,“肌肉关节疼痛缓解”,“坚果种子干果”,“油醋”,“口腔卫生”,“其他” ,“其他奶油奶酪”,“包装奶酪”,“包装肉类”,“包装家禽”,“包装农产品”,“包装海鲜”,“包装蔬菜水果”,“纸制品”,“意大利面酱”,“腌制商品橄榄”、“盘子碗杯餐具”、“爆米花干”、“家禽柜台”、“准备好的饭菜”、“准备好的汤沙拉”、“腌制蘸酱”、“蛋白质代餐”、“红酒”、“冷藏”、“冷藏布丁甜点”、“沙拉酱配料”、“海鲜柜台”、“剃须需求”、“皮肤护理”、“肥皂”、“软饮料”、“汤汤”、“无乳糖”、 “特色奶酪”、“特色葡萄酒香槟”、“香料调味料”、“烈酒”、“涂抹酱”、“茶”、“豆腐肉替代品”、“玉米饼扁平面包”、“小道混合小吃组合”、“垃圾袋”衬里”,“维生素补充剂”,“苏打水苏打水”,“白葡萄酒”,“酸奶”),类别 = “因子”),结构(c(134L、120L、99L、99L、120L、54L、105L, 12L), .Label = c("空气清新剂蜡烛",“亚洲食品”、“婴儿配饰”、“婴儿沐浴身体护理”、“婴儿配方奶粉”、“烘焙甜点”、“烘焙原料”、“烘焙用品装饰”、“美容”、“啤酒冷却器”、“身体”乳液肥皂”,“面包”,“早餐面包店”,“早餐棒糕点”,“散装干果蔬菜”,“散装谷物米干货”,“面包卷”,“黄油”,“糖果巧克力”,“罐头水果苹果酱”、“罐装蔬菜罐头”、“豆类罐头”、“海鲜罐头”、“猫粮护理”、“谷物”、“脆饼”、“清洁产品”、“可可饮料混合物”、“咖啡”、“感冒过敏”、“调味品”、“饼干蛋糕”、“饼干”、“奶油”、“除臭剂”、“尿布湿巾”、“消化”、“餐具清洁剂”、 “狗粮护理”,“面团明胶烘焙混合物”,“干意大利面”,“鸡蛋”,“能量燕麦棒”,“能量运动饮料”,“眼耳护理”,“面部护理”,“女性护理”, “急救”、“食品储存”、“新鲜蘸酱”、“新鲜水果”、“新鲜香草”、“新鲜意大利面”、“新鲜蔬菜”、“冷冻开胃菜”、“冷冻面包面团”、“冷冻早餐”、“冷冻甜点”、“冷冻果汁”、“冷冻餐”、“冷冻肉类海鲜”、“冷冻比萨”、“冷冻农产品”、“冷冻素食”、“水果蔬菜零食”、“谷物米干货” 、“格兰诺拉麦片”、“护发”、“蜂蜜糖浆”、“热麦片煎饼混合物”、“热狗培根香肠”、“冰淇淋冰”、“冰淇淋配料”、“印度食品”、“速溶食品” ”,“果汁花蜜”,“厨房用品”,“犹太食品”,“拉丁食品”,“洗衣店”,“午餐肉”,“腌制肉类”,“肉类柜台”,“牛奶”,“薄荷口香糖” ,“失踪”,“更多家庭”,“肌肉关节疼痛缓解”,“坚果种子干果”,“油醋”,“口腔卫生”,“其他”,“其他奶油奶酪”,“包装奶酪”,“包装肉类”、“包装家禽”、“包装农产品”、“包装海鲜”、“包装蔬菜水果”、“纸制品”、“意大利面酱”、“腌制品橄榄”、“盘子碗杯餐具”、“爆米花干” ”、“家禽柜台”、“准备好的饭菜”、“准备好的汤沙拉”、“腌制蘸酱”、“蛋白质代餐”、“红酒”、“冷藏”、“冷冻布丁甜点”、“沙拉酱配料”、“海鲜柜台”、“剃须需求”、“护肤”、“肥皂”、“软饮料”、“汤汤”、“无乳糖”、“特色奶酪” 、“特色葡萄酒香槟”、“香料调味料”、“烈酒”、“涂抹酱”、“茶”、“豆腐肉替代品”、“玉米饼扁平面包”、“小道混合小吃”、“垃圾袋衬垫”、“维生素补充剂”、“苏打水苏打水”、“白葡萄酒”、“酸奶”)、类别 = “因子”)、结构(c(13L、30L、43L、14L、14L、14L、14L、26L、129L、 33L, 111L, 44L, 44L), .Label = c("空气清新剂蜡烛”、“亚洲食品”、“婴儿配饰”、“婴儿沐浴身体护理”、“婴儿食品配方”、“烘焙甜点”、“烘焙原料”、“烘焙用品装饰”、“美容”、“啤酒”冷却器”、“润肤露肥皂”、“面包”、“早餐面包店”、“早餐棒糕点”、“散装干果蔬菜”、“散装谷物米干货”、“面包卷”、“黄油”、“糖果”巧克力”、“水果苹果酱罐头”、“罐装蔬菜罐头”、“豆类罐头”、“海鲜罐头”、“猫粮护理”、“谷物”、“椒盐脆饼”、“清洁产品”、“可可饮料混合物”、“咖啡”、“感冒过敏”、“调味品”、“饼干蛋糕”、“饼干”、“奶油”、“除臭剂”、“尿布湿巾”、“消化”、 “餐具清洁剂”、“狗粮护理”、“面团明胶烘焙混合物”、“干意大利面”、“鸡蛋”、“能量燕麦棒”、“能量运动饮料”、“眼耳护理”、“面部护理”、 “女性护理”、“急救”、“食物储存”、“新鲜蘸酱”、“新鲜水果”、“新鲜香草”、“新鲜意大利面”、“新鲜蔬菜”、“冷冻开胃菜”、“冷冻面包面团”、“冷冻早餐”、“冷冻甜点”、“冷冻果汁”、“冷冻食品”、“冷冻肉类海鲜”、“冷冻比萨”、“冷冻农产品”、“冷冻素食主义者”、“水果蔬菜”零食”、“谷物米干”、“格兰诺拉麦片”、“护发”、“蜂蜜糖浆”、“热麦片煎饼混合物”、“热狗培根香肠”、“冰淇淋冰”、“冰淇淋配料” ,“印度食品”,“速食食品”,“果汁花蜜”,“厨房用品”,“犹太食品”,“拉丁食品”,“洗衣店”,“午餐肉”,“腌制肉类”,“肉类柜台”,“牛奶”,“薄荷口香糖”,“失踪”,“更多家庭”,“肌肉关节疼痛缓解”,“坚果种子干果”,“油醋”,“口腔卫生”,“其他”, “其他奶油奶酪”、“包装奶酪”、“包装肉类”、“包装家禽”、“包装农产品”、“包装海鲜”、“包装蔬菜水果”、“纸制品”、“意大利面酱”、“腌制品”橄榄”、“盘子碗杯餐具”、“爆米花干”、“家禽柜台”、“准备好的饭菜”、“准备好的汤沙拉”、“腌制蘸酱”、“蛋白质代餐”、“红葡萄酒”、“冷藏”、“冷藏布丁甜点”、“沙拉酱配料”、“海鲜柜台”、“剃须需求”、“护肤”、“肥皂”、“软饮料”、“汤汤”、 “大豆无乳糖”、“特色奶酪”、“特色葡萄酒香槟”、“香料调味料”、“烈酒”、“涂抹酱”、“茶”、“豆腐肉替代品”、“玉米饼扁平面包”、“小道混合零食混合” ”、“垃圾袋衬垫”、“维生素补充剂”、“苏打水苏打水”、“白葡萄酒”、“酸奶”)、类别 =“因子”)、结构(c(51L、113L、107L、99L、84L) , 100L, 132L,78L, 96L, 94L, 75L, 97L, 32L, 19L, 54L, 125L, 100L, 32L, 11L, 94L, 100L, 51L, 41L, 51L, 51L, 33L), .Label = c("空气清新剂蜡烛", “亚洲食品”、“婴儿配饰”、“婴儿沐浴身体护理”、“婴儿配方奶粉”、“烘焙甜点”、“烘焙原料”、“烘焙用品装饰”、“美容”、“啤酒冷却器”、“身体”乳液肥皂”,“面包”,“早餐面包店”,“早餐棒糕点”,“散装干果蔬菜”,“散装谷物米干货”,“面包卷”,“黄油”,“糖果巧克力”,“罐头水果苹果酱”、“罐装罐装蔬菜”、“罐装豆类”、“肉类海鲜罐头”、“猫粮护理”、“谷物”、“椒盐脆饼”、“清洁产品”、“可可饮料混合物”、“咖啡”、“感冒过敏”、“调味品”、“饼干蛋糕”、 “饼干”、“奶油”、“除臭剂”、“尿布湿巾”、“消化”、“餐具清洁剂”、“狗粮护理”、“面团明胶烘焙混合物”、“干面食”、“鸡蛋”、“能量”格兰诺拉麦片棒”、“能量运动饮料”、“眼耳护理”、“面部护理”、“女性护理”、“急救”、“食物储存”、“新鲜蘸酱”、“新鲜水果”、“新鲜草药” ", "新鲜意大利面”、“新鲜蔬菜”、“冷冻开胃菜”、“冷冻面包面团”、“冷冻早餐”、“冷冻甜点”、“冷冻果汁”、“冷冻餐”、“冷冻肉类海鲜”、“冷冻披萨” ”、“冷冻农产品”、“冷冻素食”、“水果蔬菜零食”、“谷物米干制品”、“格兰诺拉麦片”、“头发护理”、“蜂蜜糖浆花蜜”、“热谷物煎饼混合物”、“热狗培根香肠”、“冰淇淋冰”、“冰淇淋配料”、“印度食品”、“速溶食品”、“果汁花蜜”、“厨房用品”、“犹太食品”、“拉丁食品”、“洗衣”、“午餐肉”、“腌肉准备”、“肉类柜台”、“牛奶”、“薄荷口香糖”、“失踪”、“更多家庭”、“肌肉关节疼痛缓解”、“坚果种子干果” 、“油醋”、“口腔卫生”、“其他”、“其他奶油奶酪”、“包装奶酪”、“包装肉类”、“包装家禽”、“包装农产品”、“包装海鲜”、“包装蔬菜水果”、“纸制品”、“意大利面酱”、“腌制品橄榄”、“盘子碗杯餐具”、“爆米花干”、“家禽柜台”、“准备好的饭菜”、“准备好的汤沙拉”、“腌制蘸酱”、“蛋白质代餐”、“红酒”、“冷藏”、“冷藏布丁甜点”、“沙拉酱配料”、“海鲜柜台”、“剃须需求”、“护肤”、“肥皂” ”、“软饮料”、“汤汤”、“无乳糖”、“特色奶酪”、“特色葡萄酒香槟”、“香料调味料”、“烈酒”、“涂抹酱”、“茶”、“豆腐肉替代品” ”、“玉米饼扁平面包”、“小道混合零食组合”、“垃圾袋衬垫”、“维生素补充剂”、“苏打水苏打水”、“白葡萄酒”、“酸奶”)、class = "factor"), structure(c(111L, 80L, 1L), .Label = c("空气清新剂蜡烛", "亚洲食品", "婴儿配饰", "婴儿沐浴身体护理", "婴儿食品配方”、“烘焙甜点”、“烘焙原料”、“烘焙用品装饰”、“美容”、“啤酒冷却器”、“润肤露肥皂”、“面包”、“早餐面包店”、“早餐棒糕点”、“散装”蔬菜干”、“大米干货”、“面包卷”、“黄油”、“糖果巧克力”、“水果苹果酱罐头”、“罐装蔬菜罐头”、“罐头豆类”、“罐头肉类海鲜” , "猫粮护理”、“谷物”、“脆饼干”、“清洁产品”、“可可饮料混合物”、“咖啡”、“感冒过敏”、“调味品”、“饼干蛋糕”、“饼干”、“奶油” ”,“除臭剂”,“尿布湿巾”,“消化”,“餐具清洁剂”,“狗粮护理”,“面团明胶烘焙混合物”,“干意大利面”,“鸡蛋”,“能量燕麦棒”,“能量运动饮料”、“眼耳护理”、“面部护理”、“女性护理”、“急救”、“食物储藏”、“新鲜蘸酱”、“新鲜水果”、“新鲜香草”、“新鲜意大利面” , "新鲜蔬菜”、“冷冻开胃菜”、“冷冻面包面团”、“冷冻早餐”、“冷冻甜点”、“冷冻果汁”、“冷冻餐”、“冷冻肉类海鲜”、“冷冻披萨”、“冷冻农产品” ”、“冷冻素食”、“水果蔬菜零食”、“谷物米干货”、“格兰诺拉麦片”、“护发”、“蜂蜜糖浆花蜜”、“热麦片煎饼混合物”、“热狗培根香肠”、 “冰淇淋冰”、“冰淇淋配料”、“印度食品”、“速食食品”、“果汁花蜜”、“厨房用品”、“犹太食品”、“拉丁食品”、“洗衣店”、“午餐肉”、“腌制肉类”、“肉类柜台”、“牛奶”、“薄荷口香糖”、“失踪”、“更多家庭”、“肌肉关节疼痛缓解”、“坚果种子干果”、“油醋汁” ”、“口腔卫生”、“其他”、“其他奶油奶酪”、“包装奶酪”、“包装肉类”、“包装家禽”、“包装农产品”、“包装海鲜”、“包装蔬菜水果”、“纸商品”、“意大利面酱”、“腌制品橄榄”、“盘子碗杯子餐具”、“爆米花干”、“家禽柜台”、“准备好的饭菜”、“准备好的汤沙拉”、“腌制蘸酱”、“蛋白质代餐”、“红酒”、“冷藏”、“冷藏布丁甜点”、“沙拉酱配料”、“海鲜柜台”、“剃须需求”、“护肤”、“肥皂” 、“软饮料”、“汤汤”、“无乳糖”、“特色奶酪”、“特色葡萄酒香槟”、“香料调味品”、“烈酒”、“涂抹酱”、“茶”、“豆腐肉替代品” ,“玉米饼扁平面包”,“trail mix 零食混合物”,“垃圾袋衬里”,“维生素补充剂”,“苏打水苏打水”,“白葡萄酒”,“酸奶”),class = "factor"))), .Names = c("order_id", "basket"), row.names = c(NA, -5L), class = c("tbl_df", "tbl", "data.框架”))
r - 在 R 中使用 Apriori 算法预测多个输出
目前我正在使用item-item
基于推荐系统r
。我使用的包是arules
. 我已经完成了我的基本模型,但我想用以下标准修改我的模型:
- 在先验
algo
。我们将只收到一个输出,而不是多个输出。我想要 rhs 侧的多个输出值。例如:
- 我的推荐系统完全基于
item-item
. 是否存在任何其他算法或程序包r
可以为我提供更好的业务输出? - 如何计算置信度和支持值?就我而言,我使用的是默认值。
我的代码如下:
提前致谢。
python - 具有相互依赖值的矩阵中的矢量化计算
我正在以多个时间分辨率跟踪多个离散时间序列,从而得到一个 SxRxB 矩阵,其中 S 是时间序列的数量,R 是不同分辨率的数量,B 是缓冲区,即每个序列记住多少个值。每个系列都是离散的,并使用有限范围的自然数来表示其值。我将在这里称这些“符号”。
对于每个系列,我想计算在所有测量中任何先前测量的符号直接在当前测量的任何符号之前的频率。我已经通过如下所示的 for 循环解决了这个问题,但出于明显的原因想对其进行矢量化。
我不确定我构建数据的方式是否有效,所以我愿意接受建议。我认为特别是比率矩阵可以做不同的事情。
提前致谢!
预期输出(21 对,5 列坐标,然后是找到的计数):
在上面的示例中,系列 0 中的 0 在三分之二的情况下跟随系列 1 中的 2(因为缓冲区是循环的),因此 [0, 0, 1, 2, 0] 处的比率约为 0.6666。同样是系列 0,值 0 在三分之一的情况下跟随其自身,因此 [0, 0, 0, 0, 0] 处的比率将为 ~0.3333。还有一些其他的> 0.0。
我正在两个数据集上测试每个答案:一个很小的数据集(如上所示)和一个更现实的数据集(100 个系列,5 个分辨率,每个系列 10 个值,50 个符号)。
结果
Saedeas 2nd 方法是明显的赢家!非常感谢你们,大家:)
r - 使用 R 中多个变量的唯一键计算变量值
我有一个包含变量 STORE、SALES_DT、REGISTER、TRANS_ID 和 PRODUCT 的数据框。
STORE、SALES_DT、REGISTER 和 TRANS_ID 的每个唯一组合代表一个唯一事务,而不仅仅是 TRANS_ID。例如,可能存在具有相同商店、日期和交易 ID 以及产品但在不同寄存器中的交易。任何组合都是可能的。数据帧的一小部分可能是......
如何计算每个 PRODUCT 会输出类似内容的唯一交易?
我试过了:
但似乎它忽略了计数中的 group_by ,因为它输出:
sql - SQL 按最初购买的产品列出其他购买的产品并计算买家
经过多年阅读答案,终于到了我自己提出问题的时候了。
我有一个购买的产品列表和唯一的客户 ID:
我想在 Netezza SQL 中生成以下输出:
..这样我就可以看到每个产品的总购买者。至关重要的是,我还想查看对于每种产品,在这些购买者中,有多少人购买了同一列表中的其他产品。 编辑:重要的是要重申,如果他们没有购买产品 A ,我不应该让任何买家出现在 B 的列中。
请问最有效的方法是什么?
(然后我会计算出 B 购买 A 的百分比,但这部分很容易)。
谢谢!
python - 从规则冻结集中提取字符串
使用以下语句:
我得到以下格式的规则数据框:
但我需要将 a 提取Co_Apples
为字符串。
我怎样才能做到这一点?