1

我在 .CSV fromat 中有一个 200 行和 5 列的大型数据集。这是数据集的一部分:

 4.1    1.2 47.3    10954   51
 3.4    1.5 0.5 1   5316
 0.3    30.1    1.2 10  875
 0.2    0.4 119 0   0
   0    52.6    0.1 0   3.1
   0    0.3 880 0   0
   0    0.1 148 180 0
   0    0.1 490.2   0   0.4
   0    1.1 0.2 0.6 0.9
   0    0   0   0   0

我想编写一个代码来分别读取每 10 行并使用 for 循环将其存储在一个矩阵(10 x 5)中。所以最后我有20个矩阵(10 * 5)。这是命令行:

all.data   <- read.csv("C:\\Users\\Desktop\\myarray.csv",header=FALSE)#read whole data
for (k in 1:20){   
data_temp.k <- array(NA, dim=c(10,5))
  for( i in 1:10 ){
    for( j in 1:5 ) {
        data_temp.k[i,j] <- all.data[(k-1)*10:k*10,j]
    }
  }
}
write.csv(data_temp.k,"mymatrix.k")

我知道这个问题在某种程度上与“k”及其作为矩阵索引和计数器的双重功能有关。

4

3 回答 3

5

不要为此使用循环,使用行索引:

## Sample data
set.seed(1)
m <- matrix(rnorm(1000),nrow=200,ncol=5)
## Generate indices to keep
indices <- seq(1,nrow(m), by=10)
## Subset matrix rows
m[indices,]
于 2013-10-22T20:49:58.487 回答
2

除了很好地演示如何使用arrays 并将apermmtrix 拆分为块和重塑之外,这可能并没有增加太多,所有这些都使用baseR 向量化函数。您始终可以使用 将函数应用于数组的每个维度apply

#  Sample data
m <- matrix( 1:16 , 4 , 4 )
#     [,1] [,2] [,3] [,4]
#[1,]    1    5    9   13
#[2,]    2    6   10   14
#[3,]    3    7   11   15
#[4,]    4    8   12   16

# Use array() to turn into arrays and aperm() to transpose the 3D array t0 the result you expect
out <- aperm( array( t(m) , c(4,2,2) ) , c(2,1,3) )
#, , 1
#     [,1] [,2] [,3] [,4]
#[1,]    1    5    9   13
#[2,]    2    6   10   14

#, , 2
#     [,1] [,2] [,3] [,4]
#[1,]    3    7   11   15
#[2,]    4    8   12   16

您可以在三维上应用函数,例如使用“应用”

#  Sum all the elements in each of the third dimension of your arrays
apply( out , 3 , sum )
#[1] 60 76
于 2013-10-22T21:46:26.797 回答
0

但是,如果您坚持使用for循环,那么您至少可以只使用一个而不是三个嵌套循环。

您不需要j,因为您想保留每个矩阵中的所有列。例如mat[1,]选择所有列和第 1 行;你不需要mat[1,1:ncol(mat)]

此外,您使用的方式i是不必要的,因为您每次都将不止一行(使用k-1 * 10等)子集传递给行i

最后,如果您尝试保存 20 个矩阵中的每一个,您可能需要paste.

这应该有效(未经测试):

for(k in 1:20)
 {
  data_temp.k <- all.data[((k-1)*10):(k*10),]

  write.csv(data_temp.k, paste("mymatrix", k, sep = ".")
 }
于 2013-10-22T21:10:29.627 回答