1

我有一个具有不同 p.value 值的数据框,包括缺失值(NA):pvalue2=pvalue[1:679,3:10] 我需要分析它,大于 0.05 的数字我需要写“正常” e 值小于 0.05 我需要写入值。我希望将结果写入另一个数据框中。这是我的代码:

a=data.frame()
    for (i in 1:nrow(pvalue2)) {
      for (j in 1:ncol(pvalue2)){
        if (pvalue2[i,j] >=0.05) {
          print (a[i,j]=="Normal")
        } else {print a[i,j]==pvalue2[i,j] }
      }
    } 

有人可以帮助我吗?

4

4 回答 4

2
a <- ifelse(as.matrix(pvalue2) < .05, as.matrix(pvalue2), "normal")
a <- as.data.frame(a)

由于 R 是一种未经编译的高级语言,因此for循环在增长时往往会变得非常缓慢。通过使用矢量化函数(在内部以较低级别的语言进行循环),您可以加快代码速度并使其更具可读性。

示例运行

> set.seed(123)
> pvalue2 <- matrix(runif(18)/10, 6, 3)
> pvalue2[sample(length(pvalue2), 4)] <- NA
> pvalue2 <- as.data.frame(pvalue2)
> pvalue2

          V1         V2          V3
1 0.02875775 0.05281055 0.067757064
2 0.07883051 0.08924190 0.057263340
3 0.04089769 0.05514350          NA
4 0.08830174 0.04566147 0.089982497
5 0.09404673         NA          NA
6         NA 0.04533342 0.004205953

> ifelse(as.matrix(pvalue2) < .05, as.matrix(pvalue2), "normal")

     V1                   V2                   V3                   
[1,] "0.0287577520124614" "normal"             "normal"             
[2,] "normal"             "normal"             "normal"             
[3,] "0.04089769218117"   "normal"             NA                   
[4,] "normal"             "0.0456614735303447" "normal"             
[5,] "normal"             NA                   NA                   
[6,] NA                   "0.0453334156190977" "0.00420595335308462"
于 2013-02-22T11:58:33.880 回答
1

我想,您的 p 值存储为因子。您需要先将它们转换为数值。

tmp <- sapply(pvalue2, function(x) as.numeric(as.character(x)))

现在,tmp可以使用该对象:

# copy the existing data frame to a new object
df2 <- pvalue2
# fill it with "Normal"
df2[ , ] <- "Normal"
# replace with values from tmp if value < 0.05
df2[tmp < 0.05] <- pvalue2[tmp < 0.05]
于 2013-02-22T12:05:06.843 回答
0

假设您的第一个数据框称为 df

df_2<-data.frame(matrix(nrow=nrow(df),ncol=ncol(df)));
for (i in 1:ncol(df)){
    df_2[,i]<-ifelse(is.na(df[,i]) == FALSE && df[,i] >= .05,"Normal",ifelse(is.na(df[,i])==FALSE && df[,i] < 0.05,df[,i],NA))
}
于 2013-02-22T11:33:43.107 回答
0
set.seed(42)
df <- data.frame(a=runif(10,0,0.1),b=runif(10,0,0.1))
#since there are only numeric values
#you can transform to matrix
m <- as.matrix(df)

#new matrix
m2 <- m

m2[m>0.05] <- "Normal"

df2 <- as.data.frame(m2)

                    a                  b
1              Normal  0.045774177624844
2              Normal             Normal
3  0.0286139534786344             Normal
4              Normal 0.0255428824340925
5              Normal 0.0462292822543532
6              Normal             Normal
7              Normal             Normal
8   0.013466659723781 0.0117487361654639
9              Normal 0.0474997081561014
10             Normal             Normal
于 2013-02-22T12:01:57.480 回答