我有一个df
赞:
SampleID Chr Start End Strand Value
1: rep1 1 11001 12000 - 10
2: rep1 1 15000 20100 - 5
3: rep2 1 11070 12050 - 1
4: rep3 1 14950 20090 + 20
...
而且我想加入共享相同chr
并且strand
具有相似起点和终点的行(比如100 +/-距离)。对于执行行连接的那些列,我还想连接SampleID
名称和Value
. 对于前面的示例,类似于:
SampleID Chr Start End Strand Value
1:rep1,rep2 1 11001 12000 - 10,1
2: rep1 1 15000 20100 - 5
4: rep3 1 14950 20090 + 20
...
想法?谢谢!
编辑:
我找到了 R 的模糊连接包(https://cran.r-project.org/web/packages/fuzzyjoin/index.html)。有没有人有这个包的经验?
编辑2:
如果只有一个变量 (SampleID
或Value
) 将被连接起来,那也很好。