我正在尝试做一些复杂的索引,同时平均、合并以及取最小值和最大值。开始这是一个例子data.frame
:
ID ID2 probe chrom strand txStart txEnd
Rest_3 uc001aah.4 8044649 chr1 0 14361 29370
Rest_4 uc001aah.4 7911309 chr1 0 14361 29370
Rest_5 uc001aah.4 8171066 chr1 0 14361 29370
Rest_6 uc001aah.4 8159790 chr1 0 14361 29370
Rest_17 uc001abw.1 7896761 chr1 0 861120 879961
Rest_18 uc001abx.1 7896761 chr1 0 871151 879961
我曾经duplicated
在 ID2 列中找到重复项:uc001aah.4 有 4 个重复项。但是然后我需要并且我不知道该怎么做的是只有一个 uc001aah.4 条目,然后将探测列(+其他一些)条目合并到一个单元格中(就 excel 而言)8044649, 7911309, 8171066, 8159790
所以在最后它看起来像这样:
ID ID2 probe chrom strand txStart txEnd
Rest_3,Rest_4, Rest_5, Rest_6 uc001aah.4 8044649, 7911309, 8171066, 8159790 chr1 0 14361 29370
但是对于探测列,重复也是如此:
ID ID2 probe chrom strand txStart txEnd
Rest_17 uc001abw.1 7896761 chr1 0 861120 879961
Rest_18 uc001abx.1 7896761 chr1 0 871151 879961
所以在这里我需要合并ID和ID2,同时取txStart列的最小值和txEnd列的最大值,最后得到:
ID ID2 probe chrom strand txStart txEnd
Rest_17, Rest_18 uc001abw.1, uc001abx.1 7896761 chr1 0 861120 879961
我知道这要求很多,但是如果您只是向我展示如何在第一个问题上执行此操作,我相信我将能够弄清楚如何将其应用于第二个问题。