问题标签 [pattern-mining]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

23 问题

0 投票

1 回答

19 浏览

apriori - 关联挖掘可以处理非线性关系吗？

对于一个关联规则 x->y，当提升为 1 时，x 和 y 是独立的。如果提升小于 1，则两者是负相关的，否则它们是正相关的。如果它们具有非线性相关性怎么办？关联规则/频繁项集会捕获这种关联吗？

apriori pattern-mining

2021-02-24T18:05:13.140

0 投票

0 回答

21 浏览

r - 有没有办法获得关联规则项之间的平均时间差？

我是数据挖掘的新手，对关联规则感兴趣。对于包含三个项目（ID、时间戳（日期）、产品）的数据集，如下所示：

我已经在 R 中应用了先验算法来获得关联规则及其提升、置信度和支持度。这已经很棒了！

但是，现在我对获取此类关联规则中项目之间的（平均）时间差更感兴趣。
假设：如果一个人购买了产品 12 和 01 ，他需要 xxx 天/月才能购买产品 23。

有没有办法获得这个时间信息，例如以另一种算法的形式这样做？

已经谢谢了！

r data-mining market-basket-analysis pattern-mining

2021-11-26T11:03:55.107

0 投票

0 回答

23 浏览

python - 使用 Pandas DataFrame 和距离矩阵的顺序关联规则挖掘

我已经实现了数据之间的关联。因此，在使用 TF-IDF 并计算数据之间的距离后，我有一个距离矩阵。我还生成了一个包含 50 个集群的凝聚层次聚类。现在我想预测顺序关联规则（即使文章不在同一个集群中）？有谁知道我可以使用哪种算法？

我所有的数据都按列排序，并且有一个前提条件的概念。例如，根据 1 的元素在（在时间上）根据 2 的元素之前。

这是我的数据：

分拣机	文章	买家
1	苹果	客户1 客户2 客户4
2	大米	客户 2 客户 4 客户 5
3	意大利面	客户 2 客户 3 客户 6
...

我的距离矩阵是每篇文章之间的距离，我的凝聚层次聚类是关于文章关联的。所以我想用置信度分数预测文章模式：Apples -> Rices Confident = 1 Apples, Rices -> Pastas Confident = 0.2

python machine-learning data-science sklearn-pandas pattern-mining

2022-01-07T10:19:13.193

1 2 3 4 5 6 7 8 9 10

问题标签 [pattern-mining]

apriori - 关联挖掘可以处理非线性关系吗？

r - 有没有办法获得关联规则项之间的平均时间差？

python - 使用 Pandas DataFrame 和距离矩阵的顺序关联规则挖掘

Reference