问题标签 [arules]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
10964 浏览

r - R中的排序关联规则

我正在努力实现下面所述的目标并且有很多错误。我花了很多时间尝试对规则进行排序并打印前十名。我知道如何打印出整个列表。

使用 R,探索在较大数据文件中生成规则。考虑成人数据(在 R 中可通过 >data(Adult)命令获得)。生成置信度阈值为 0.8 的关联规则

  1. 打印出按支持排序的前 10 条规则。考虑使用检查命令以及对排序规则进行排序和索引。
  2. 打印出按置信度排序的前 10 条规则。
  3. 查看生成规则,这些规则被限制为在规则的 lhs 上获得收入。请注意,收入选项有两个值:小和大。考虑包括apriori 函数的外观参数。打印按提升排序的前 10 条规则。

到目前为止,这是我的代码:

0 投票
2 回答
4966 浏览

r - arules:如何在 R 或 SQL WHERE 子句中找到与 lhs(rule) 匹配的数据?

我发现使用 arule 包有点棘手。我正在使用先验算法来查找关联规则;类似于 arules 文档中的示例。

它返回以下四个规则

我一定遗漏了一些东西:您如何仅使用 arules 函数在源数据中找到与 lhs 规则匹配的行?

有没有一种简单的方法可以从 lhs(rules) 构建 SQL WHERE 子句?

谢谢

0 投票
1 回答
85 浏览

r - 是否有我可以使用的包来获取 R 中目标结果的规则

例如,在这个给定的数据集中,我想获得每个变量的最佳值,这将产生一个预设的“百分比”值:例如,我需要“百分比”的值 >=0.7所以在这个结果应该是这样的:

示例数据集:

我无法使用决策树,因为我的数据框很大,而且我无法正确查看所有树。我尝试了这个*arules*包,但它要求所有变量都是因子,我混合了因子、逻辑和连续变量的数据集,我想保留变量并且自变量继续。我还需要“百分比”变量作为只有一个我想优化。*arules*我用包写的代码是这样的:

谢谢

0 投票
0 回答
3840 浏览

r - R中Arules序列挖掘的主序列

如何从 R 中 arulesSequence 包中的 cspade 算法中删除子序列,例如,如果我的数据(Sample.txt)如下

列名:sequenceID、EventID、size、Item

运行以下 arulesSequence 代码行后

如何在不丢失项目之间的情况下找到全长序列?

从数据上看,从A开始的主要全长序列是A(1)、A->B(1)、A->B->C(1)和A->B->C->D(0.67) ),所以我怎样才能删除中间子序列并希望得到上述结果。

这里的挑战是如何消除在 B、B->C 等之间形成的序列,以及如何消除 A->B->D 等序列(这里我丢失了实际序列;项目 C 被丢弃)

0 投票
1 回答
554 浏览

r - 在 R 中使用 arules 包进行关联规则挖掘

我正在尝试使用arulesR 中的包查找关联规则。我正在使用 csv 文件来创建事务对象。我得到一个不正确的项目集。这是数据的样子

如果您查看第 4 和 5 项,它们是相同的,但由于引号而被视为不同,第 6 和 7 项的情况类似。

有没有办法解决这个问题或发生这种情况的任何原因?

0 投票
1 回答
3676 浏览

r - 在 R 编程中将 arules 事务数据转换为项目矩阵

我有一个包含 100,000 行的数据集,交易格式如下

我想将其转换为如下矩阵格式(或 TRUE/FALSE 标志)

我尝试了以下步骤

但是,在我的列表转换中,我得到的输出为

所以有些行是完美的,但在某些行中,唯一 id 被添加到带有 \t 和 \n 的电影列表中

我想要以下格式的列表 9C05-EE9B44E8C18F c("Bruce Almighty","Iron Man","Toy Story")

这样我相信我会很容易地达到所需的结果。非常感谢您的帮助。

0 投票
1 回答
1016 浏览

r - 如何在 R 中为测试事务应用关联规则?

我有两个数据集,包括训练和测试。对于训练数据集,我提取了许多关联规则,如下所示。现在我想将这些规则用于测试交易数据集。我需要找到符合这些规则的交易 ID。帮我!

0 投票
1 回答
225 浏览

r - 从事务中删除命名列

我有一个trans使用创建的事务对象read.transaction()。如何从中删除命名列trans

0 投票
1 回答
120 浏览

r - R arules 根据数据格式冻结

我在 R 中遇到了 arules 包的问题。我正在尝试对超市数据集进行购物篮分析。如果我使用以下格式的数据:

一切正常,甚至加载数十万行:) ...但我需要以以下格式加载数据:

即使仅加载 250 行,系统也会冻结...这种格式的数据可以与 arules 一起使用吗?

有什么帮助吗?提前致谢。

0 投票
1 回答
243 浏览

r - arules 中的一步与两步关联规则挖掘 - 为什么不同?

据我了解,Apriori 算法的工作原理是首先找到满足支持阈值的所有频繁项集,然后从也满足最小置信度的频繁项集中生成强关联规则。

因此,我希望在 R 包规则中:

txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="frequent itemsets")) rules <- ruleInduction(itemsets)

txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))

会导致相同的规则,但是在第二个示例中找到了更多规则,我不明白为什么。

谁能解释这是为什么?我现在正在努力解决它一段时间..