1

我正在尝试对现有数据框的列名使用循环,然后根据旧列之一创建新列。这是我的示例数据:

 sample<-list(c(10,12,17,7,9,10),c(NA,NA,NA,10,12,13),c(1,1,1,0,0,0))
    sample<-as.data.frame(sample)
    colnames(sample)<-c("x1","x2","D")

>sample
x1  x2  D
10  NA  1
12  NA  1
17  NA  1
7   10  0
9   20  0
10  13  0

现在,我正在尝试使用for loop生成两个变量 x1.imp 和 x2.imp,它们的值在 D=1 时与 D=0 相关,在 D=0 时与 D=1 相关(这里我实际上不需要for loop但对于具有大列(变量)的原始数据集,我真的需要循环)基于以下条件:

for (i in names(sample[,1:2])){
sample$i.imp<-with (sample, ifelse (D==1, i[D==0],i[D==1]))
i=i+1
return(sample)
}


Error in i + 1 : non-numeric argument to binary operator

但是,以下工作,但它没有将新 cols 的名称命名为 imp.x2 和 imp.x3

for(i in sample[,1:2]){
impt.i<-with(sample,ifelse(D==1,i[D==0],i[D==1]))
i=i+1
print(as.data.frame(impt.i))
 }

impt.i
1      7
2      9
3     10
4     10
5     12
6     17
  impt.i
1     10
2     12
3     13
4     NA
5     NA
6     NA

请注意,我已经知道没有循环[here]的解决方案。我想要循环。

预期输出:

x1  x2  D   x1.impt x2.imp 
10  NA  1   7       10      
12  NA  1   9       20
17  NA  1   10      13
7   10  0   10      NA
9   20  0   12      NA
10  13  0   17      NA

我将非常感谢您在这方面的宝贵意见。

4

2 回答 2

3

这太疯狂了,但是既然您要求这样做...您的代码更改最少将是:

for (i in colnames(sample)[1:2]){
  sample[[paste0(i, '.impt')]] <- with(sample, ifelse(D==1, get(i)[D==0],get(i)[D==1]))
}

几点评论:

  1. 换成names(sample[,1:2])更优雅的colnames(sample)[1:2]
  2. $是用于交互式使用。相反,在编程时,即要解释列名时,您需要使用[or [[,因此我替换sample$i.impsample[[paste0(i, '.impt')]]
  3. 在里面withi[D==0]不会给你x1[D==0]什么时候i"x1",因此需要使用get.
  4. 你不应该命名你的 data.framesample因为它也是一个非常常见的函数的名称
于 2013-03-16T01:04:30.253 回答
1

这应该工作,

test <- sample[,"D"] == 1
for (.name in names(sample)[1:2]){
  newvar <- paste(.name, "impt", sep=".")
  sample[[newvar]] <- ifelse(test, sample[!test, .name], 
                                   sample[test, .name]) 
}

sample
于 2013-03-16T00:52:21.570 回答