1

我有一个值矩阵,每行排列在不同的列中。我希望我的代码做什么:

  1. 遍历一行 -> 检查列的值是否 < 阈值(例如 1)
  2. 在该行内,如果有 80% 的列满足该条件,则保留该行;否则删除整行。

到目前为止的代码:

myfilt <- function(t,x){
             if ((length(which(t[x,] > 1)) / 60) >= 0.8){
               return(1)
             }else{
               return(0)
             }
          }

y=c()
for(i in 1:length(t[,1])){
   y = c(y,myfilt(t,i))
}

但是当我打印t[v,]所有行具有相同的值时:(不知道我做错了什么。另外,如果有更短的方法可以做到这一点,请告诉我。

PS:这里的't'是我正在测试的矩阵的名称

4

1 回答 1

2

这是一种方法:

## Parameters
threshold <- 0.8
perc.to.keep <- 0.5
## Example Matrix
set.seed(1337)
m <- matrix(rnorm(25,1,1),nrow=5,ncol=5)

#           [,1]      [,2]        [,3]       [,4]      [,5]
# [1,] 1.7122837 0.8383025 -0.02718379  2.2157099 2.1291008
# [2,] 0.2462742 2.4602621 -0.04117532 -0.6214087 1.4501467
# [3,] 1.0381899 3.0094584  0.12937698  0.9314247 1.0505864
# [4,] 2.1784211 0.9220618  1.85313022  0.9370171 0.8756698
# [5,] 0.8467962 2.3543421  0.37723981  2.0757077 1.9120115

test <- m < threshold
sel <- apply(test,1,function(v) sum(v)/length(v)) < perc
m[sel,]

#           [,1]      [,2]        [,3]      [,4]      [,5]
# [1,] 1.7122837 0.8383025 -0.02718379 2.2157099 2.1291008
# [2,] 1.0381899 3.0094584  0.12937698 0.9314247 1.0505864
# [3,] 2.1784211 0.9220618  1.85313022 0.9370171 0.8756698
# [4,] 0.8467962 2.3543421  0.37723981 2.0757077 1.9120115
于 2013-03-22T16:02:42.553 回答