1

我有一个大的data.frame,其中第一列看起来像:

“COL”
ELOVL6
ELOVL7
ELP2
EMC1(包括 EG:23065)
EPT1(包括 EG:28042)
ZEB1(包括 EG:29009)

我想删除所有(包括 EG:...)以获得以下输出:

“COL”
ELOVL6
ELOVL7
ELP2
EMC1
EPT1
ZEB1

有什么建议吗?

非常感谢提前

4

2 回答 2

8
 I suppose y your column of the data.frame

 sapply(as.list(y),function(x){gsub("(.*)\\(.*\\)", "\\1", x)})

编辑

更简单

 gsub("(.*)\\(.*\\)", "\\1", x)
于 2012-11-27T10:54:16.247 回答
2

你的意思是这样的......

COL <- c("ELOVL7",
         "ELP2",
         "EMC1 (includes EG:23065)",
         "EPT1 (includes EG:28042)",
         "ZEB1 (includes EG:29009)")

COL <- data.frame(COL)
data.frame(COL=sapply(strsplit(as.character(COL[,1]), split=" "), '[', 1))
     COL
1 ELOVL7
2   ELP2
3   EMC1
4   EPT1
5   ZEB1
于 2012-11-27T10:54:28.650 回答