问题标签 [apriori]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 来自 spmf 的关联规则中的 R 子集
代码:
我正在使用 fp-growth 从 spmf 获得的 csv 文件上尝试上述代码以获取关联规则。我希望删除所有在 lhs 中具有“1”的规则,但这不起作用。
.csv 文件:
2 ==> 1 #SUP: 1 #CONF: 0.33333 #LIFT: 0.66667
1 ==> 2 #SUP: 1 #CONF: 0.33333 #LIFT: 0.66667
3 ==> 1 #SUP:2 #CONF:0.5 #LIFT:1
1 ==> 3 #SUP:2 #CONF:0.66667 #LIFT:1
3 ==> 2 #SUP:2 #CONF:0.5 #LIFT:1
2 ==> 3 #SUP:2 #CONF:0.66667 #LIFT:1
2 3 ==> 1 #SUP:1 #CONF:0.5 #LIFT:1
1 3 ==> 2 #SUP:1 #CONF:0.5 #LIFT:1
1 2 ==> 3 #SUP:1 #CONF:1 #LIFT:1.5
3 ==> 1 2 #SUP: 1 #CONF: 0.25 #LIFT: 1.5
2 ==> 1 3 #SUP: 1 #CONF: 0.33333 #LIFT: 1
1 ==> 2 3 #SUP: 1 #CONF: 0.33333 #LIFT: 1
r - 如何在 R 中为测试事务应用关联规则?
我有两个数据集,包括训练和测试。对于训练数据集,我提取了许多关联规则,如下所示。现在我想将这些规则用于测试交易数据集。我需要找到符合这些规则的交易 ID。帮我!
data-mining - 对数据挖掘的最低支持和最低信心
我想知道是否可以在挖掘关联规则中自动确定最小支持度和最小置信度?如果是这样,任何指向资源的提示或指针都会很棒。
database - 先验算法的数据集无法转换为 csv
我去了这个网站 fimi.ua.ac.be/data/ 并下载了零售数据集。我尝试了一切将其转换为 .csv 但我无法获得 csv 的格式。谁能帮我把这个零售数据集文件转换成 csv?请帮忙。谢谢。
r - 将类规则的对象转换为R中的数据框
我有一个apriori
函数输出,它挖掘数据并给出一组规则。我想将其转换为数据框以进行进一步处理。规则对象如下所示:
我们可以使用数据框创建规则对象。数据框如下所示:
比我们可以使用这个得到输出变量:
有用过的arules
包。dput(output)
给出了这个:
r - 使用 arules/apriori 过滤 rhs 不起作用
我将 arules::apriori 与二进制矩阵一起使用,并且只想创建在 RHS 上有一个特定列的规则。这是在文档中指定的,但似乎不起作用。事后过滤它很容易得到这个,但我首先浪费了大量的计算时间来计算所有规则。
例子:
规则现在包含 3378 条规则
rules.sub 包含 172 条规则
在我的实际数据中,我从数百万个结果变为 ~4000 个,这是一个巨大的差异。
r - R中带有先验函数的错误消息 - 无法强制列表包含交易
我是stackoverflow的新手,所以在阅读我的问题时请考虑到这一点......谢谢你的帮助。
我正在尝试在 R 中运行先验函数,但出现错误:
不能用重复名称的事务强制列表
我不知道我的数据在 CSV 文件中的格式是否存在问题,或者我是否缺少程序中的步骤。
- 加载 CSV 文件
mydata<-lapply(mydata, as.factor)
rules<-apriori(mydata,parameter=list(supp=.01,conf=.7))
asMethod(object) 中的错误:无法强制列出具有重复项的事务
我的数据被格式化为交易列表,每个可用产品(列)为 1 或 0:
python - 如何在python中为apriori算法生成k-itemset
这是我第一次尝试在 python 中编写代码,并且正在实现 Apriori 算法。我已经生成了 2 项集,下面是我必须通过组合 1 项集的键来生成 2 项集的功能。
如何使此功能通用?我的意思是,通过传递字典的键和元组中所需的元素数量,算法应该使用这些键生成所有可能的 n-number(k+1) 个子集。我知道集合上的联合是一种可能性,但是有没有办法将元组联合起来,这本质上是字典的键?
例如,如果我的初始字典看起来像:{key, value} --> value 是频率
我把这个字典的键传递给上面提到的candidate_gen 函数,它将生成2-itemsets 的子集并给出键的输出。然后,我将通过与原始数据库进行比较来将密钥传递给函数以查找频率,从而获得以下输出:
如何从上述键生成 3 项集子集。
r - R.先验。预处理数据以了解规则中属性的名称
我正在使用数据集“成人”。 http://archive.ics.uci.edu/ml/datasets/Adult 我已经使用 apriori 检索了频繁的规则并通过提升对其进行排序。
当我执行
我获得以下内容:
ETC
例如,在规则中:
我怎么知道那个0
和那个13
是哪个属性?我已经查看了数据集的描述和数据本身,所以我猜这13
是教育数字和0
资本损失,但有时两个或多个属性可以具有相同的范围,所以我不知道如何区分它们.
我在这里读过:我们怎么知道规则中生成的项目的列名/属性,问题是我没有预处理数据。那么,我该怎么做呢?
非常感谢!
text - 文本的 Apriori 算法
我参加了数据挖掘课程,我们必须apriori algorithm
在带有文本(即字符串)的数据集上运行。
我可以获得任何代码或帮助来运行先验算法吗?
提前致谢