2

我有一个数据框(8 个变量的 451 个 obs),它有两列(6 和 7),如下所示:

  Major      Minor
  C:726      T:2
  A:687      G:41
  T:3        C:725

我想创建一个总结这一点的专栏。为此,我不关心每个单元格中的字母,但我希望保留更大的数字,无论它在哪一行。即我希望它看起来像这样:

  Summary_column
  726
  687
  725

没必要,但对于那些想知道我在做什么的人来说,这是一个名为 VCFtools 的程序的输出;它有一个计数功能,可以计算 VCF 中的等位基因,但有时当等位基因明显更常见时,它会将等位基因命名为“次要”。

谢谢你的帮助!

4

1 回答 1

3

我会做这样的事情:

extract <- function(v) {
  gsub("^.*:", "", v)
}
within(d, Summary_column <- pmax(extract(Major), extract(Minor)))

这使 :

  Major Minor Summary_column
1 C:726   T:2            726
2 A:687  G:41            687
3   T:3 C:725            725
于 2013-05-07T10:17:31.253 回答