问题标签 [arules]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中规则的序列事务类
尝试arulesSequences
在 R 中使用包。遇到这个问题我看到很多人遇到但没有好的答案:从数据框或矩阵到事务数据类型。
正如文档明确指出的那样,我已经为 arules 做到了这一点:
工作正常。但是,如果我尝试对 3 列数据框做同样的事情,一切都会变得混乱:
是的,有重复,但这正是重点,不是吗?(寻找频繁的序列集)。
所以,现在我像这样强制:
我得到:
我一直在试图通过这个简单的障碍:
- 更改拆分顺序
- 把一切都变成因素
- 把一切都变成矩阵
- 像这样直接将数据框输入到 arules 函数中
- 导出为 .txt,导入为 read.transactions
- 导出为 .txt,作为“篮子”导入
- 尝试“解决方案”:here、here和here(read_baskets 是一个函数?)
所有错误都是上述错误,或者当我没有得到任何错误时,我得到一个包含两列的事务对象,因为它需要三列,所以当然无法读取arulesSequences
:1) SEQUENCE-ID、EVENT-ID、ITEMS。
我认为我的数据库结构再清晰不过了。序列是“客户编号”,事件 ID 是购买编号和商品,嗯,商品。
请感谢任何帮助,包括“as()”希望看到的结构,以便它正确执行强制。
r - 将 arules 包从常规格式转换为稀疏格式
我正在尝试将我的常规数据集转换为稀疏格式。所有文档都有“稀疏格式”的例子你能帮帮我吗?
我的样本数据集:
arules - 向 arulesViz 输入外部规则
我有一个规则的 excel 文件:先行列,结果列,支持列等
我正在尝试创建一个“规则”对象来使用 arulesViz 绘制它们。
http://www.inside-r.org/packages/cran/arules/docs/rhs
我正在尝试创建插槽
要创建 itemMatrix 我需要回到稀疏矩阵,但我认为这行不通,有没有办法将规则“导入”到 arulesViz?
Excel文件:
r - 在规则中将项目信息添加到交易对象
我正在使用该arules
软件包在销售点零售数据中查找关联规则。我正在从数据库中提取交易细节,然后放入一个transaction
对象中。我是新手arules
,正在尝试弄清楚如何itemInfo
在事务对象中填充数据框。现在,我只是引入了transaction
and item ID
s(都是数字),它们提供的上下文很少。我希望能够添加项目描述以及产品层次结构级别。
以下是我今天使用的过程:
数据来自数据库,格式如下:
/li>要创建
transaction
对象,我使用以下命令,如arules
文档中所述:注意:我发现我需要为
Item_ID
.创建和查看关联规则
/li>
当规则回来时,它们由 列出Item_ID
,这对我没有帮助。我希望能够通过ID
和/或描述来显示它们。此外,希望利用arules
包中内置的聚合功能。
r - 如何预处理来自 UCI 的原始数据以创建 itemFrequencyPlot?
我想对投票数据集进行分类分析。我在 UCI 存储库中找到了,但我很难对其进行预处理,以便能够在 r 中使用 arules 包。所以数据看起来部分像这样。
使用“read.csv”导入数据后。当我在“成人”数据集示例中阅读时,我尝试直接使用它,但我得到了错误
我还尝试通过使用 excel 将整个数据更改为二进制矩阵,即删除党列并添加具有二进制值的共和党和民主党列,并将其他列中的 Ys、Ns 和问号转换为 1s、0s 和 NAs分别。我不断收到同样的错误。谁能建议我可以用来使用 itemFrequencyPlot 和 Apriori 函数的任何预处理函数或教程。
r - 从 arules 对规则进行后处理
apriori
有没有办法在 arules 包中生成的单个规则中使用多个级别的单个变量?
考虑以下示例:
输出>
在这个例子中,如果我得到 rule 会很有帮助{V1=a,b,V2=d}
。其他一些工具(例如LISp-Miner)可以生成使用多级变量的规则。
r - arules 包在空白中读取为项目
在 arules 包中,您可以读取交易数据,例如示例杂货数据集:
如果您随后检查您获得的交易:
如您所见,它认为每笔交易中的第一项都是空白。它应该如下所示:
我不确定最新版本的 R 中是否发生了某些变化,因为使用上述确切代码的示例不会遇到此问题。
这是原始 csv 文件在编辑器中的样子(前 2 行):
尾随逗号的存在是有原因的……它们表明该行(事务)的项目少于项目最多的事务。但正是这些逗号导致了问题。
如果没有 arules 包认为这些空白是项目,我如何阅读这个 csv 文件?
r - 我们如何将规则与 R 的推荐实验室包中的其他方法进行比较
我正在尝试使用 R 中的包推荐实验室比较推荐算法。只想知道如何将关联规则合并到算法列表中进行比较(可以使用 arules 包的结果)
# 要添加 "Assoc-Rules" = "arules etc."
r - How to remove the extra commas from a csv file?
I was trying to use a csv file in R in read.transactions()
command from arules package.
The csv file when opened in Notepad++ shows extra commas for every non-existing values. So, I'm having to manually delete those extra commas before using the csv in read.transactions()
. For example, the actual csv file when opened in Notepad++ looks like:
I want it to appear like below while sending it into read.transactions()
:
Is there any way I can make that change in read.transactions()
itself, or any other way? But even before that, we don't get to see those extra commas in R(that output I showed was from Notepad++)..
So how can we even remove them in R when we can't see it?