我有一个大的data.frame,其中第一列看起来像:
“COL”
ELOVL6
ELOVL7
ELP2
EMC1(包括 EG:23065)
EPT1(包括 EG:28042)
ZEB1(包括 EG:29009)
我想删除所有(包括 EG:...)以获得以下输出:
“COL”
ELOVL6
ELOVL7
ELP2
EMC1
EPT1
ZEB1
有什么建议吗?
非常感谢提前
我有一个大的data.frame,其中第一列看起来像:
“COL”
ELOVL6
ELOVL7
ELP2
EMC1(包括 EG:23065)
EPT1(包括 EG:28042)
ZEB1(包括 EG:29009)
我想删除所有(包括 EG:...)以获得以下输出:
“COL”
ELOVL6
ELOVL7
ELP2
EMC1
EPT1
ZEB1
有什么建议吗?
非常感谢提前
I suppose y your column of the data.frame
sapply(as.list(y),function(x){gsub("(.*)\\(.*\\)", "\\1", x)})
编辑
更简单
gsub("(.*)\\(.*\\)", "\\1", x)
你的意思是这样的......
COL <- c("ELOVL7",
"ELP2",
"EMC1 (includes EG:23065)",
"EPT1 (includes EG:28042)",
"ZEB1 (includes EG:29009)")
COL <- data.frame(COL)
data.frame(COL=sapply(strsplit(as.character(COL[,1]), split=" "), '[', 1))
COL
1 ELOVL7
2 ELP2
3 EMC1
4 EPT1
5 ZEB1