问题标签 [pattern-mining]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
19 浏览

apriori - 关联挖掘可以处理非线性关系吗?

对于一个关联规则 x->y,当提升为 1 时,x 和 y 是独立的。如果提升小于 1,则两者是负相关的,否则它们是正相关的。如果它们具有非线性相关性怎么办?关联规则/频繁项集会捕获这种关联吗?

0 投票
0 回答
21 浏览

r - 有没有办法获得关联规则项之间的平均时间差?

我是数据挖掘的新手,对关联规则感兴趣。对于包含三个项目(ID、时间戳(日期)、产品)的数据集,如下所示:

我已经在 R 中应用了先验算法来获得关联规则及其提升、置信度和支持度。这已经很棒了!

但是,现在我对获取此类关联规则中项目之间的(平均)时间差更感兴趣。
假设:如果一个人购买了产品 12 和 01 ,他需要 xxx 天/月才能购买产品 23。

有没有办法获得这个时间信息,例如以另一种算法的形式这样做?

已经谢谢了!

0 投票
0 回答
23 浏览

python - 使用 Pandas DataFrame 和距离矩阵的顺序关联规则挖掘

我已经实现了数据之间的关联。因此,在使用 TF-IDF 并计算数据之间的距离后,我有一个距离矩阵。我还生成了一个包含 50 个集群的凝聚层次聚类。现在我想预测顺序关联规则(即使文章不在同一个集群中)?有谁知道我可以使用哪种算法?

我所有的数据都按列排序,并且有一个前提条件的概念。例如,根据 1 的元素在(在时间上)根据 2 的元素之前。

这是我的数据:

分拣机 文章 买家
1 苹果 客户1 客户2 客户4
2 大米 客户 2 客户 4 客户 5
3 意大利面 客户 2 客户 3 客户 6
...

我的距离矩阵是每篇文章之间的距离,我的凝聚层次聚类是关于文章关联的。所以我想用置信度分数预测文章模式:Apples -> Rices Confident = 1 Apples, Rices -> Pastas Confident = 0.2