r - 如何删除大型data.frame中的相同行

Question

我有一个如下所示的 data.frame：

GN  PN  
a   3.4   
a   3.4   
a   9.8   
d   8.4   
e   9 
e   6.5

我想要以下输出：

GN  PN  
a   3.4   
a   9.8   
d   8.4   
e   9 
e   6.5

（相同的行将被删除！）

我正在尝试使用发布在：多列比较中的代码，但没有成功，因为复制的行（3.4）仍然存在。我有一个很大的 data.frame（大约 66.000 行和 10 列）。

真实案例：

 GN     SP                PN
A1CF   52573692   TCGA-B6-A0RS-01A-11D-A099
A1CF   52595854   TCGA-BH-A0HP-01A-12D-A099 
A1CF   52595854   TCGA-BH-A0HP-01A-12D-A099
A1CF   52595937   TCGA-BH-A18P-01A-11D-A12B
A2BP1  7568361    TCGA-D8-A1JN-01A-11D-A13L
A2BP1  7102099    TCGA-E2-A1BC-01A-11D-A14G
A2BP1  7102099    TCGA-E2-A1BC-01A-11D-A14G
A2BP1  7383011    TCGA-AR-A1AJ-01A-21D-A12Q
A2BP1  7383011    TCGA-AR-A1AJ-01A-21D-A12Q
A2BP1  7568188    TCGA-BH-A18J-01A-11D-A12B
A2BP1  7629860    TCGA-AO-A03O-01A-11W-A019
A2BP1  7629860    TCGA-AO-A03O-01A-11W-A019

score 1 · Accepted Answer

1

只需使用：

 unique(df)

这使：

  GN  PN
1  a 3.4
3  a 9.8
4  d 8.4
5  e 9.0
6  e 6.5

于 2013-03-22T15:18:26.160 回答

score 1 · Accepted Answer

1

也许你可以试试new.df=subset(df,!duplicate(df))

于 2013-03-22T15:23:19.523 回答

r - 如何删除大型data.frame中的相同行

2 回答 2

Related

Reference