问题标签 [arules]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

345 问题

0 投票

1 回答

10964 浏览

r - R中的排序关联规则

我正在努力实现下面所述的目标并且有很多错误。我花了很多时间尝试对规则进行排序并打印前十名。我知道如何打印出整个列表。

使用 R，探索在较大数据文件中生成规则。考虑成人数据（在 R 中可通过 >data(Adult)命令获得）。生成置信度阈值为 0.8 的关联规则

打印出按支持排序的前 10 条规则。考虑使用检查命令以及对排序规则进行排序和索引。
打印出按置信度排序的前 10 条规则。
查看生成规则，这些规则被限制为在规则的 lhs 上获得收入。请注意，收入选项有两个值：小和大。考虑包括apriori 函数的外观参数。打印按提升排序的前 10 条规则。

到目前为止，这是我的代码：

2014-04-08T17:52:28.447

0 投票

2 回答

4966 浏览

r - arules：如何在 R 或 SQL WHERE 子句中找到与 lhs(rule) 匹配的数据？

我发现使用 arule 包有点棘手。我正在使用先验算法来查找关联规则；类似于 arules 文档中的示例。

它返回以下四个规则

我一定遗漏了一些东西：您如何仅使用 arules 函数在源数据中找到与 lhs 规则匹配的行？

有没有一种简单的方法可以从 lhs(rules) 构建 SQL WHERE 子句？

谢谢

r apriori arules

2014-04-24T22:55:36.633

0 投票

1 回答

85 浏览

r - 是否有我可以使用的包来获取 R 中目标结果的规则

例如，在这个给定的数据集中，我想获得每个变量的最佳值，这将产生一个预设的“百分比”值：例如，我需要“百分比”的值 >=0.7所以在这个结果应该是这样的：

示例数据集：

我无法使用决策树，因为我的数据框很大，而且我无法正确查看所有树。我尝试了这个*arules*包，但它要求所有变量都是因子，我混合了因子、逻辑和连续变量的数据集，我想保留变量并且自变量继续。我还需要“百分比”变量作为只有一个我想优化。*arules*我用包写的代码是这样的：

谢谢

r optimization arules

2014-05-28T07:30:07.897

0 投票

0 回答

3840 浏览

r - R中Arules序列挖掘的主序列

如何从 R 中 arulesSequence 包中的 cspade 算法中删除子序列，例如，如果我的数据（Sample.txt）如下

列名：sequenceID、EventID、size、Item

运行以下 arulesSequence 代码行后

如何在不丢失项目之间的情况下找到全长序列？

从数据上看，从A开始的主要全长序列是A(1)、A->B(1)、A->B->C(1)和A->B->C->D(0.67) )，所以我怎样才能删除中间子序列并希望得到上述结果。

这里的挑战是如何消除在 B、B->C 等之间形成的序列，以及如何消除 A->B->D 等序列（这里我丢失了实际序列；项目 C 被丢弃)

r sequence arules

2014-06-25T17:45:46.237

0 投票

1 回答

554 浏览

r - 在 R 中使用 arules 包进行关联规则挖掘

我正在尝试使用arulesR 中的包查找关联规则。我正在使用 csv 文件来创建事务对象。我得到一个不正确的项目集。这是数据的样子

如果您查看第 4 和 5 项，它们是相同的，但由于引号而被视为不同，第 6 和 7 项的情况类似。

有没有办法解决这个问题或发生这种情况的任何原因？

r sparse-matrix arules

2014-07-25T20:06:09.217

0 投票

1 回答

3676 浏览

r - 在 R 编程中将 arules 事务数据转换为项目矩阵

我有一个包含 100,000 行的数据集，交易格式如下

我想将其转换为如下矩阵格式（或 TRUE/FALSE 标志）

我尝试了以下步骤

但是，在我的列表转换中，我得到的输出为

所以有些行是完美的，但在某些行中，唯一 id 被添加到带有 \t 和 \n 的电影列表中

我想要以下格式的列表 9C05-EE9B44E8C18F c("Bruce Almighty","Iron Man","Toy Story")

这样我相信我会很容易地达到所需的结果。非常感谢您的帮助。

r apriori arules binary-matrix

2014-07-25T21:37:06.907

0 投票

1 回答

1016 浏览

r - 如何在 R 中为测试事务应用关联规则？

我有两个数据集，包括训练和测试。对于训练数据集，我提取了许多关联规则，如下所示。现在我想将这些规则用于测试交易数据集。我需要找到符合这些规则的交易 ID。帮我！

r apriori arules

2014-08-13T10:47:48.737

0 投票

1 回答

225 浏览

r - 从事务中删除命名列

我有一个trans使用创建的事务对象read.transaction()。如何从中删除命名列trans？

r arules

2014-08-29T16:50:50.827

0 投票

1 回答

120 浏览

r - R arules 根据数据格式冻结

我在 R 中遇到了 arules 包的问题。我正在尝试对超市数据集进行购物篮分析。如果我使用以下格式的数据：

一切正常，甚至加载数十万行:) ...但我需要以以下格式加载数据：

即使仅加载 250 行，系统也会冻结...这种格式的数据可以与 arules 一起使用吗？

有什么帮助吗？提前致谢。

r arules

2014-09-12T22:14:14.077

0 投票

1 回答

243 浏览

r - arules 中的一步与两步关联规则挖掘 - 为什么不同？

据我了解，Apriori 算法的工作原理是首先找到满足支持阈值的所有频繁项集，然后从也满足最小置信度的频繁项集中生成强关联规则。

因此，我希望在 R 包规则中：

txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="frequent itemsets")) rules <- ruleInduction(itemsets)

和

txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))

会导致相同的规则，但是在第二个示例中找到了更多规则，我不明白为什么。

谁能解释这是为什么？我现在正在努力解决它一段时间..

r data-mining arules

2014-09-17T15:48:50.900

1 2 3 4 5 6 7 8 9 10

问题标签 [arules]

Reference