0

我有一个很长的列(excel 中有 9500 行),其中有很多基因 ID。我想删除重复项。

ID
BXDC2                     
BXDC5                   
BXDC5                     
BZRPL1                    
BZRPL1                                       
C10orf11         
C10orf116                                 
C10orf119              
C10orf120    
C10orf125          
C10orf125       

我希望结果是:

ID
BXDC2                     
BXDC5                                      
BZRPL1                    
C10orf11         
C10orf116                                 
C10orf119              
C10orf120    
C10orf125         

谁能帮我写一个 R 脚本:-)?

4

1 回答 1

4

您可以使用duplicatedunique。在这里,我假设列名是“ID”

 df1[!duplicated(df1$ID),,drop=FALSE]

或者

  library(data.table)#v1.9.4+
  unique(setDT(df1), by='ID')
于 2015-07-11T11:18:58.440 回答