2

我有一个带有字符数据的 data.frame,我希望得到一个具有相同列标题但每个值都有计数的矩阵。到目前为止,我可以获得我想要的维度的空矩阵,但是当我尝试填充myMatrix计数时,它不起作用。

myData <- data.frame(a=LETTERS[5:8], b=LETTERS[6:9], c=rep(LETTERS[5:6],2), d=rep(LETTERS[7],4))
#   a b c d
# 1 E F E G
# 2 F G F G
# 3 G H E G
# 4 H I F G
myValues <- sort(unique(unlist(myData))) # E F G H I
myList <- lapply(myData, table)
myMatrix <- matrix(nrow=length(myValues), ncol=length(myList), dimnames=list(myValues,names(myList)))
#    a  b  c  d
# E NA NA NA NA
# F NA NA NA NA
# G NA NA NA NA
# H NA NA NA NA
# I NA NA NA NA

到目前为止,一切都很好。这是不符合我期望的部分:

lapply(seq_along(myList), function(i) {myMatrix[names(myList[[i]]),names(myList[i])] <- myList[[i]]})

它返回正确的值,但myMatrix仍然充满了 NA。奇怪的是,这个有效:

myMatrix[names(myList[[2]]),names(myList[2])] <- myList[[2]]
#    a  b  c  d
# E NA NA NA NA
# F NA  1 NA NA
# G NA  1 NA NA
# H NA  1 NA NA
# I NA  1 NA NA

为什么分配myMatrix失败lapply,我怎样才能让它工作(没有for循环)?

4

3 回答 3

5

这是一种将返回 data.frame 的方法

# create table, convert to data.frames then give appropriate column names
myList <- Map(setNames, lapply(lapply(myData, table), data.frame),  Map(c, 'Var', names(myList)))
# merge recursively
Reduce(function(...) merge(..., by = 'Var', all = T), myList)
  Var  a  b  c  d
1   E  1 NA  2 NA
2   F  1  1  2 NA
3   G  1  1 NA  4
4   H  1  1 NA NA
5   I NA  1 NA NA
于 2012-12-06T01:42:24.047 回答
2

@orizo​​n 是正确的,为什么您的使用lapply没有按预期工作。您必须替换<-<<-它才能工作,但通常认为*apply函数具有这种副作用是不好的做法。

相反,您可以使用

sapply(lapply(myData, factor, unique(unlist(myData))), table)

#   a b c d
# E 1 0 2 0
# F 1 1 2 0
# G 1 1 0 4
# H 1 1 0 0
# I 0 1 0 0
于 2012-12-06T01:59:30.707 回答
1

table一旦您将所有内容折叠回两个向量,一次调用即可获得所需的结果。1 个向量用于 中的值data.frame,1 个向量用于列标识符,使用col

table(unlist(myData), colnames(myData)[col(myData)])

结果:

  a b c d
E 1 0 2 0
F 1 1 2 0
G 1 1 0 4
H 1 1 0 0
I 0 1 0 0
于 2012-12-06T01:48:50.407 回答