问题标签 [pattern-mining]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apriori - 关联挖掘可以处理非线性关系吗?
对于一个关联规则 x->y,当提升为 1 时,x 和 y 是独立的。如果提升小于 1,则两者是负相关的,否则它们是正相关的。如果它们具有非线性相关性怎么办?关联规则/频繁项集会捕获这种关联吗?
r - 有没有办法获得关联规则项之间的平均时间差?
我是数据挖掘的新手,对关联规则感兴趣。对于包含三个项目(ID、时间戳(日期)、产品)的数据集,如下所示:
我已经在 R 中应用了先验算法来获得关联规则及其提升、置信度和支持度。这已经很棒了!
但是,现在我对获取此类关联规则中项目之间的(平均)时间差更感兴趣。
假设:如果一个人购买了产品 12 和 01 ,他需要 xxx 天/月才能购买产品 23。
有没有办法获得这个时间信息,例如以另一种算法的形式这样做?
已经谢谢了!
python - 使用 Pandas DataFrame 和距离矩阵的顺序关联规则挖掘
我已经实现了数据之间的关联。因此,在使用 TF-IDF 并计算数据之间的距离后,我有一个距离矩阵。我还生成了一个包含 50 个集群的凝聚层次聚类。现在我想预测顺序关联规则(即使文章不在同一个集群中)?有谁知道我可以使用哪种算法?
我所有的数据都按列排序,并且有一个前提条件的概念。例如,根据 1 的元素在(在时间上)根据 2 的元素之前。
这是我的数据:
分拣机 | 文章 | 买家 |
---|---|---|
1 | 苹果 | 客户1 客户2 客户4 |
2 | 大米 | 客户 2 客户 4 客户 5 |
3 | 意大利面 | 客户 2 客户 3 客户 6 |
... |
我的距离矩阵是每篇文章之间的距离,我的凝聚层次聚类是关于文章关联的。所以我想用置信度分数预测文章模式:Apples -> Rices Confident = 1 Apples, Rices -> Pastas Confident = 0.2