7

我正在寻找一种更通用的方法来从 data.frame 获取多维数组。

我希望能够根据需要从数据框中的尽可能多的变量中创建尽可能多的维度。

目前,该方法必须针对每个 data.frame 进行定制,需要转租以形成向量。

我会喜欢 plyr 中的熔化/铸造方法。

   data<-data.frame(coord.name=rep(1:10, 2),
             x=rnorm(20),
             y=rnorm(20),
             ID=rep(c("A","B"), each=10))


    data.array<-array(dim=c(10, 2, length(unique(data$ID))))

    for(i in 1:length(unique(data$ID))){
      data.array[,1,i]<-data[data$ID==unique(data$ID)[i],"x"]
      data.array[,2,i]<-data[data$ID==unique(data$ID)[i],"y"]
    }

data.array
, , 1

      [,1] [,2]
 [1,]    1    1
 [2,]    3    3
 [3,]    5    5
 [4,]    7    7
 [5,]    9    9
 [6,]    1    1
 [7,]    3    3
 [8,]    5    5
 [9,]    7    7
[10,]    9    9

, , 2

      [,1] [,2]
 [1,]    2    2
 [2,]    4    4
 [3,]    6    6
 [4,]    8    8
 [5,]   10   10
 [6,]    2    2
 [7,]    4    4
 [8,]    6    6
 [9,]    8    8
[10,]   10   10
4

2 回答 2

7

由于某种微妙的原因,您可能无法应用reshape2函数。困难在于您的 data.frame 没有可用于指导您如何沿输出数组的第一维排列元素的列。

下面,我明确添加了这样一个列,将其命名为"row". 有了它,您可以使用表达式acast()dcast()函数以您选择的任何方式重塑数据。

library(reshape2)

# Use this or some other method to add a column of row indices.
data$row <- with(data, ave(ID==ID, ID, FUN = cumsum))

m <- melt(data, id.vars = c("row", "ID"))
a <- acast(m, row ~ variable ~ ID)

a[1:3, , ]
# , , A
# 
#   x y
# 1 1 1
# 2 3 3
# 3 5 5
#
# , , B
# 
#   x y
# 1 2 2
# 2 4 4
# 3 6 6
于 2012-04-05T23:07:26.043 回答
4

我认为这是对的:

array(unlist(lapply(split(data, data$ID), function(x) as.matrix(x[ , c("x", "y")]))), c(10, 2, 2))
于 2012-04-05T23:04:23.190 回答