1

我有一个带有列标题和行名的大数据框,即

CountTable = read.table( 数据, header=TRUE, row.names=1 )

头(计数表)

        S1    S2    S3
Row1     9     8     2 
Row2   268   193   282
Row3   635   631   568
Row4     0     2     0
Row5    15     8    10
Row6   416   321   350
... etc

我想从中检索基于名称的行。如果我只有几个要检索,我会使用方括号函数,例如

CountTable[c("Row1", "Row3", "Row6",]

        S1    S2    S3
Row1     9     8     2 
Row3   635   631   568
Row6   416   321   350

但由于我的数据框有 >20,000 行,我想从中检索 ~2000 行,这不是很实用。我最好的想法是,是否有办法从另一个文件(例如,names.txt/.cvs)导入约 2000 个名称并创建索引向量,例如

[1] 第 1 行 第 3 行 第 6 行 ... 第 2000 行

这可以用来指定在创建我的数据子集时要检索哪些行?

任何解决方案将不胜感激!

4

1 回答 1

3

如果您基于行名进行子集化,您应该按照以下方式做一些事情

CountTable[rownames(CountTable) %in% c("row1", "row2", "row3"), ]

要构造行名向量,您可以使用

paste0("row", 1:10)
[1] "row1"  "row2"  "row3"  "row4"  "row5"  "row6"  "row7"  "row8"  "row9" 
[10] "row10"
于 2013-07-19T22:24:38.533 回答