问题标签 [arules]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中的排序关联规则
我正在努力实现下面所述的目标并且有很多错误。我花了很多时间尝试对规则进行排序并打印前十名。我知道如何打印出整个列表。
使用 R,探索在较大数据文件中生成规则。考虑成人数据(在 R 中可通过 >data(Adult)
命令获得)。生成置信度阈值为 0.8 的关联规则
- 打印出按支持排序的前 10 条规则。考虑使用检查命令以及对排序规则进行排序和索引。
- 打印出按置信度排序的前 10 条规则。
- 查看生成规则,这些规则被限制为在规则的 lhs 上获得收入。请注意,收入选项有两个值:小和大。考虑包括
apriori
函数的外观参数。打印按提升排序的前 10 条规则。
到目前为止,这是我的代码:
r - arules:如何在 R 或 SQL WHERE 子句中找到与 lhs(rule) 匹配的数据?
我发现使用 arule 包有点棘手。我正在使用先验算法来查找关联规则;类似于 arules 文档中的示例。
它返回以下四个规则
我一定遗漏了一些东西:您如何仅使用 arules 函数在源数据中找到与 lhs 规则匹配的行?
有没有一种简单的方法可以从 lhs(rules) 构建 SQL WHERE 子句?
谢谢
r - 是否有我可以使用的包来获取 R 中目标结果的规则
例如,在这个给定的数据集中,我想获得每个变量的最佳值,这将产生一个预设的“百分比”值:例如,我需要“百分比”的值 >=0.7所以在这个结果应该是这样的:
示例数据集:
我无法使用决策树,因为我的数据框很大,而且我无法正确查看所有树。我尝试了这个*arules*
包,但它要求所有变量都是因子,我混合了因子、逻辑和连续变量的数据集,我想保留变量并且自变量继续。我还需要“百分比”变量作为只有一个我想优化。*arules*
我用包写的代码是这样的:
谢谢
r - R中Arules序列挖掘的主序列
如何从 R 中 arulesSequence 包中的 cspade 算法中删除子序列,例如,如果我的数据(Sample.txt)如下
列名:sequenceID、EventID、size、Item
运行以下 arulesSequence 代码行后
如何在不丢失项目之间的情况下找到全长序列?
从数据上看,从A开始的主要全长序列是A(1)、A->B(1)、A->B->C(1)和A->B->C->D(0.67) ),所以我怎样才能删除中间子序列并希望得到上述结果。
这里的挑战是如何消除在 B、B->C 等之间形成的序列,以及如何消除 A->B->D 等序列(这里我丢失了实际序列;项目 C 被丢弃)
r - 在 R 中使用 arules 包进行关联规则挖掘
我正在尝试使用arules
R 中的包查找关联规则。我正在使用 csv 文件来创建事务对象。我得到一个不正确的项目集。这是数据的样子
如果您查看第 4 和 5 项,它们是相同的,但由于引号而被视为不同,第 6 和 7 项的情况类似。
有没有办法解决这个问题或发生这种情况的任何原因?
r - 在 R 编程中将 arules 事务数据转换为项目矩阵
我有一个包含 100,000 行的数据集,交易格式如下
我想将其转换为如下矩阵格式(或 TRUE/FALSE 标志)
我尝试了以下步骤
但是,在我的列表转换中,我得到的输出为
所以有些行是完美的,但在某些行中,唯一 id 被添加到带有 \t 和 \n 的电影列表中
我想要以下格式的列表 9C05-EE9B44E8C18F c("Bruce Almighty","Iron Man","Toy Story")
这样我相信我会很容易地达到所需的结果。非常感谢您的帮助。
r - 如何在 R 中为测试事务应用关联规则?
我有两个数据集,包括训练和测试。对于训练数据集,我提取了许多关联规则,如下所示。现在我想将这些规则用于测试交易数据集。我需要找到符合这些规则的交易 ID。帮我!
r - 从事务中删除命名列
我有一个trans
使用创建的事务对象read.transaction()
。如何从中删除命名列trans
?
r - R arules 根据数据格式冻结
我在 R 中遇到了 arules 包的问题。我正在尝试对超市数据集进行购物篮分析。如果我使用以下格式的数据:
一切正常,甚至加载数十万行:) ...但我需要以以下格式加载数据:
即使仅加载 250 行,系统也会冻结...这种格式的数据可以与 arules 一起使用吗?
有什么帮助吗?提前致谢。
r - arules 中的一步与两步关联规则挖掘 - 为什么不同?
据我了解,Apriori 算法的工作原理是首先找到满足支持阈值的所有频繁项集,然后从也满足最小置信度的频繁项集中生成强关联规则。
因此,我希望在 R 包规则中:
txs <- as(inputDataTable,"transactions")
itemsets <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="frequent itemsets"))
rules <- ruleInduction(itemsets)
和
txs <- as(inputDataTable,"transactions")
rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))
会导致相同的规则,但是在第二个示例中找到了更多规则,我不明白为什么。
谁能解释这是为什么?我现在正在努力解决它一段时间..