0

我正在使用 R 中的 for 循环模拟几个数据集,并将数据集保存在文件夹中的文本文件中。由于我需要分析这些数据集,我将这些数据从文件夹导入到 R 并进行分析。我想知道是否有任何方法可以通过将它们作为数据框保存在 R 中而不是保存和导入来进行模拟和分析。这是我的代码:

setwd("C:\\Users\\John\\Desktop\\datageneration")

kitem<-10
N<-100
disc<-rnorm(k,0,1)
diff=rnorm(k,0,1)

irtp<-function(t,a,b,pexp)
{
    pexp<-1/(1+exp(-b*(t-a)))
    pexp
}
for( iter in 1:20) 
{
    X<-mat.or.vec(N,kitem)
    P<-mat.or.vec(N,kitem)
    for(i in 1:N)
    {
        theta<-rnorm(N,0,1)
        assign(paste0("theta", iter), theta)
        filename1 <- paste (" theta",iter ,".txt ", sep ="")
        write.table( get(paste0("theta",iter)) , file = filename1 , row.names =FALSE ,col.names = FALSE )
        for(k in 1:kitem)
        {
            P[i,k]<-irtp(theta[i],diff[k],disc[k],pexp)
            X[i,k]<-ifelse(runif(1)<P[i,k],1,0)
            assign(paste0("X",iter), X)         # HERE'S THE PART THAT I NEED HELP
            filename2 <- paste ("X",iter ,".txt ", sep ="")
            write.table( get(paste0("X",iter)) , file = filename2 , row.names =FALSE ,col.names = FALSE )
        }
    }
}

我想做的只是通过调用它们的名称(例如,theta1)来使用生成的数据文件(例如,theta1、theta2、theta3...、theta20)。由于我正在生成数千个数据集,我想知道是否可以在不使用 write.table 然后 read.table 函数的情况下做到这一点。如果您能帮助我,我将不胜感激。

4

3 回答 3

1

编辑以反映对 X 矩阵的需要:使用您的模拟数据创建一个包含 20 + 20 个项目的列表,并相应地命名成员:

kitem<-10
N<-100
disc<-rnorm(kitem,0,1)  # not ( k, ... )
diff=rnorm(kitem,0,1)   # not ( k, ... )
pexp <- 1                   # ??? - not needed here

# the list that takes all the produced data
mySim <- as.list( NULL )

# function definition reduced to the necessary
irtp <- function( t, a, b ) {  1 / ( 1 + exp( -b * ( t -a ) ) ) }

for( iter in 1:20 )
{
  # create two matrices to be filled later
  X<-mat.or.vec(N,kitem)
  P<-mat.or.vec(N,kitem)

  # create and name the theta component
  theta = mySim[[ iter ]] <- rnorm( N, 0, 1 )
  names( mySim )[ iter ] <- paste ( "theta", iter, sep ="" )

  # fill and save the matrices
  for( i in 1:N )
  {
    for( k in 1:kitem )
    {
      P[i,k]<-irtp(theta[i],diff[k],disc[k] )  #  don"t need this: ,pexp)
      X[i,k]<-ifelse(runif(1)<P[i,k],1,0)
    }
  }
  mySim[[ 20 + iter ]] <- X
  names( mySim )[ 20 + iter ] <- paste ( "X", iter, sep ="" )
}

如果需要,您可以将列表完全保存为 R 对象。

现在您可以将每个模拟命名为:

head( mySim$theta3 )
[1]  0.96068066  0.01966067 -1.25682531 -0.15128916 -0.75950710 -1.22243883

您可以将矩阵、数据框等添加到列表中

mySim$tau1 <- c( "lists", "take", "everything" )

您可以选择性地使用相应的文件名保存列表成员:

filename <- paste( names( mySim )[3], ".txt", sep = "" )
write.table( mySim$theta3, filename )

你是这么想的吗?

于 2013-06-09T05:38:29.203 回答
0

这些 Rda 文件中的对象都将具有相同的名称“theta”,因此如果不覆盖任何早期版本,您将无法加载它们。如果你想不带名字地保存它们,你可以使用saveRDSreadRDS给它们不同的名字。save()如果您想在 get -ed之前给它们起不同的名称,请使用assign然后以您当前使用的方式保存。

综上所述,我会更容易列出二十个具有不同名称的此类对象,然后一次保存它们并一次加载它们。

N=10
for ( iter in 1:3) 
{
      theta<-rnorm(N,0,1)
    assign(paste0("theta", iter), theta)
    filename1 <- paste (" theta",iter ,".txt ", sep ="")
    write.table( get(paste0("theta",iter)) , file = filename1 , row.names =FALSE ,col.names = FALSE )
}

> ls(patt="theta")
[1] "theta"  "theta1" "theta2" "theta3"
于 2013-06-09T04:57:59.973 回答
0

目前尚不清楚你想做什么,但我认为这replicate就是你需要的。

ss <- replicate(20,replicate(N,rnorm(N,0,1)))
于 2013-06-09T03:44:09.417 回答