k<-21;
for(i in 5:k)
{
pharma[,i][pharma[,i]=="#N/A"]<- NA
pharma[,i][pharma[,i]=="NM"]<- NA
num<-sum(is.na(pharma[,i]))
n=1-num/length(pharma[,i])
if(n<0.8) {
rm(pharma[,i])
Else n=0
}
}
基本上试图用 NA 替换列并删除那些有太多 NA 的列。
k<-21;
for(i in 5:k)
{
pharma[,i][pharma[,i]=="#N/A"]<- NA
pharma[,i][pharma[,i]=="NM"]<- NA
num<-sum(is.na(pharma[,i]))
n=1-num/length(pharma[,i])
if(n<0.8) {
rm(pharma[,i])
Else n=0
}
}
基本上试图用 NA 替换列并删除那些有太多 NA 的列。
您没有告诉我们代码创建的错误。但有几点观察:
Else
不一样else
也不Else
正确if
在 . 之前关闭语句else
。你可能想要类似的东西
## extract the columns to manipulate
pp <- pharma[,5:21]
## set relevant values to NA
pp <- lapply(pp,function(x) x[x %in% c("#N/A","NM")] <- NA)
## estimate fraction NA and test
badcols <- colMeans(is.na(pp))>0.2
## remove bad columns
pp <- pp[,!badcols]
## put the manipulated stuff back together with the original structure
pharma <- cbind(pharma[,1:4],pp)
但如果没有可重复的例子,很难准确地说出。