1

我正在处理 R 包规则。我有一个 csv 文件,其中 6 列分别命名为:item1、item2、item3、item4、item5、item6。每个单元格代表一个篮子中的一个项目,每一行代表一个交易的整个篮子。问题是在将 csv 文件读取为:

data <- read.csv('file.csv')

并将其转化为交易后:

trans <- as(data, "transactions")

我发现那些空的单元格被视为名称下的项目,即'itme3 ='。有没有办法指定必须忽略空单元格,或者是否可以从 R 事务数据中消除某些项目?

4

1 回答 1

0

我认为您用于 trans 的代码不起作用。

你可以尝试这样做。以两列格式排列数据。类似的

  1. 用户1:一个
  2. 用户 2:b
  3. 用户1:c
  4. 用户1:一个
  5. 用户 2:d
  6. 用户 2:b

这样做后删除重复的行。在上面的示例中,它将是第 2 行和第 6 行。然后您可以使用包的代码进行转置,即:

#Transposing data to run algorithm
trans1 = split(mydate$product, mydata$user_id,"transactions")

因此,当您运行上述拆分代码时,结果将是一个对象,而不是数据帧。然后你可以继续运行先验。

于 2017-04-29T14:58:43.017 回答