2

我有以下数据框'x'

id,item,volume
a,c1,2
a,c2,3
a,c3,2
a,c4,1
a,c5,4
b,c6,6
b,c1,2
b,c3,1
b,c2,6
b,c4,4
c,c2,5
c,c8,6
c,c9,2
d,c1,1
e,c3,7
e,c2,3
e,c1,2
e,c9,5
e,c4,1
f,c1,7
f,c3,1

第一列是客户的id,第二列是客户购买的商品的id,第三列是购买的商品数量。我正在尝试创建一个共现矩阵,它是一个有 8 行和 8 列的方阵,8 是不同项目的数量。

n = length(unique(x$cid))

这可以通过 SAC 范式来完成吗?对于每个 id,我需要通过为每个组合添加 +1 来更新上述矩阵。例如,对于具有项目 c1、c2、c3、c4、c6 的用户“b”,矩阵中第 2、3、4 和 6 列的第一行应递增 1,依此类推。我无法将它投入到这个框架中。非常感谢任何帮助。

4

2 回答 2

2

正如@joran 提到的那样,它不清楚你真正想要什么。但如果我理解正确(可能不是),我想提出一条替代路线。我想你想要一个项目矩阵,其中的数字代表项目共享客户的次数?

如果是这样,那么:

library(igraph)
library(tnet)
id_item<-cbind(
i=c(1,1,2,2,2,2,2,3,4,5,5,5,6,6,7,8),  #items
p=c(1,2,1,2,3,4,5,2,3,4,5,6,6,7,8,8))  #customers
item_item<-projecting_tm(id_item, method="sum")
item_item <- tnet_igraph(item_item,type="weighted one-mode tnet")
itemmat<-get.adjacency(item_item,attr="weight")
itemmat  #8x8 martrix of items to items

#     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
#[1,]    0    2    1    0    0    0    0    0
#[2,]    2    0    1    1    2    0    0    0
#[3,]    1    1    0    0    0    0    0    0
#[4,]    0    1    0    0    0    0    0    0
#[5,]    0    2    0    0    0    1    0    0
#[6,]    0    0    0    0    1    0    0    0
#[7,]    0    0    0    0    0    0    0    1
#[8,]    0    0    0    0    0    0    1    0

如果您还需要考虑购买商品的次数(数量),那么这很容易添加到此代码中。

于 2012-05-13T02:34:12.087 回答
1

rehsape2 提供“acast”,这可能是您想要的:

> acast(x, id~item,value.var='volume')
  c1 c2 c3 c4 c5 c6 c8 c9
a  2  3  2  1  4 NA NA NA
b  2  6  1  4 NA  6 NA NA
c NA  5 NA NA NA NA  6  2
d  1 NA NA NA NA NA NA NA
e  2  3  7  1 NA NA NA  5
f  7 NA  1 NA NA NA NA NA

reshape2::dcast 生成一个数据帧,如果这样更方便的话。

于 2012-05-13T02:40:25.067 回答