我有一个大矩阵,我想从中随机提取一个较小的矩阵。(我想这样做 1000 次,所以最终它会在一个 for 循环中。)例如,我有这个 9x9 矩阵:
mat=matrix(c(0,0,1,0,1,0,0,0,1,0,0,0,0,1,1,1,0,0,1,0,1,0,0,0,0,0,1,0,1,0,0,0,1,
0,0,0,0,1,1,1,0,0,1,0,1,0,0,0,0,0,1,0,1,0,0,0,1,0,0,0,0,1,1,1,0,0,
1,0,1,0,0,0,0,0,1,0,1,0,0,0,1), nrow=9)
从这个矩阵中,我想要一个随机的 3x3 子集。诀窍是我不希望最终矩阵中的任何行或列总和为 0。另一个重要的事情是我需要知道最终矩阵中的原始行数和列数。因此,如果我最终随机选择第 4、5 和 7 行以及第 1、3 和 8 列,我希望在最终矩阵中轻松访问这些标识符。
这是我到目前为止所做的。
首先,我创建了一个行号和列号的向量。我试图让这些始终与矩阵保持联系。
r.num<-seq(from=1,to=nrow(mat),by=1) #vector of row numbers
c.num<-seq(from=0, to=(ncol(mat)+1),by=1) #vector of col numbers (adj for r.num)
mat.1<-cbind(r.num,mat)
mat.2<-rbind(c.num,mat.1)
现在我有一个带有标识符的 10x10 矩阵。我可以通过创建一个随机向量并对矩阵进行子集化来选择我的行。
rand <- sample(r.num,3)
temp1 <- rbind(mat.2[1,],mat.2[rand,]) #keep the identifier row
这很好用!现在我想随机选择 3 列。这就是我遇到麻烦的地方。我试着用同样的方法做。
rand2 <- sample(c.num,3)
temp2 <- cbind(temp1[,1],temp1[,rand2])
问题是我最终得到了一些为 0 的行和列的总和。我可以首先消除总和为 0 的列。
temp3 <- temp1[,which(colSums(temp1[2:nrow(temp1),])>0)]
cols <- which(colSums(temp1[2:nrow(temp1),2:ncol(temp1)])>0)
rand3 <- sample(cols,3)
temp4 <- cbind(temp3[,1],temp3[,rand3])
但我最终收到一条错误消息。出于某种原因,R 不喜欢以这种方式对矩阵进行子集化。
所以我的问题是,在删除零列之后,是否有更好的方法通过随机向量“rand3”对矩阵进行子集化,或者是否有更好的方法来随机选择三个互补的行和列,这样总和不等于0?
非常感谢你的帮助!