2

对我来说,这是一个简单但可笑的艰苦过程。我试图弄清楚如何从数据中制作一组矩阵。

如果你有 R,

data(iris)
dim(iris)

[1] 150   5

是维度

iris 是 R 编程中给出的数据

当你这样做

iris(3)
dim(iris3)

[1] 50  4  3

你得到一组三个矩阵,分为“物种”相关列

我如何编程/编码,以便我可以为其他数据集执行此操作???

感谢您的时间和访问

4

1 回答 1

3

abind您正在从abind包中寻找功能:

> library(abind)
> IrisArray <- abind(split(iris[, -5], iris[,5]), along=3)
> dim(IrisArray)
[1] 50  4  3  # these are the dimensions you want.

如果你想要一个函数,那么看看这个:

library(abind)
Splitbyfactor <- function(x, by='Species'){
  ind <-  which(colnames(x)==by)
  abind(split(x[, -ind], x[,ind]), along=3)
}

dim(Splitbyfactor(iris,  by='Species'))
[1] 50  4  3

编辑

此编辑用于回答您的评论,假设您有一个名为的 data.frame,df由两列随机数和第三个包含 ID 的列组成,这些 ID 是大写字母 A、B、C、D、E 和 F,这意味着您有 5 个不同的 ID 进行分割,则along调用中的参数abind不必设置为 5,因为它不是指 ID 的数量,而是指结果数组的维度;)。看这个例子

> df <- data.frame(A=rnorm(10), B=rnorm(10), ID=rep(LETTERS[1:5], each=6)) 
> dim(df)
[1] 30  3
> dim(Splitbyfactor(df,  by='ID'))
[1] 6 2 5
于 2013-03-25T14:47:18.177 回答