0

我有一个关于在我的数据集中进行过滤的问题。我的数据集如下所示:

      PROJECT       FREQ
1       <NA>         NA
2       <NA>         NA
3       FSHD 0.01282051
4       <NA>         NA
5       <NA>         NA
6  GROEI,CMS 0.02564103
7       <NA>         NA
8      GROEI 0.00000132
9       <NA>         NA
10  NMD,BRCA 0.03846154

这是我的问题:我想丢弃 PROJECT 字段中没有的所有行:GROEI 和 FREQ 字段中:大于 0.01。

我想过这样的事情,但这不是办法..

a1<-a[!(a$PROJECT != "GROEI" & a$FREQINHDB >= 0.02),]

谁能帮我这个?

谢谢!

4

1 回答 1

3

由于您想匹配部分字符串,您可以使用grepl正则表达式与您的数据进行匹配:

na.omit(a[!grepl("GROEI", a$PROJECT), ])
    n  PROJECT       FREQ
3   3     FSHD 0.01282051
10 10 NMD,BRCA 0.03846154
于 2012-07-05T10:34:14.633 回答