r - 通过特定标记选择表格中的行

翻译自：https://stackoverflow.com/questions/19228178 2013-10-07T14:59:38.537

68 次

0

我有一个巨大的数据文件。在一列中，我有一个特定的大字母序列，看起来像“FAPYGTITSAKVMRTE”。这样的序列大约有 1000 行。对我来说重要的是选择那些序列中至少有一个“K”的序列。其余的我可以忽略。如何从整个数据集中挑选这些序列？如果需要，我可以在某处上传数据文件。

1 回答 1

3

尝试使用grepl

> set.seed(2)
> df <- data.frame(sequences=replicate(10, paste0(sample(LETTERS[7:12], 5, TRUE), collapse=""))) # example

>df[grepl("K", df$sequence), , drop = FALSE] # thanks to Henrik's comment
   sequences
1      HKJHL
3      JHKHI
7      GGKLJ
8      JLHKG
10     KLIJK

于 2013-10-07T15:08:41.480 回答