我尝试使用 findOverlap 来解决这个问题,但我只找到没有条件的重叠区域,所以如果我有一些条件来选择数据。我应该怎么做?
假设我有两个数据框,如下所示
数据框
Sample, start, stop, event, probe, length, length/probe, region
CNV1234, 2000, 3000, CN gain, 23, 235, 9, intron
CNV1534, 1200, 1800, CN loss, 60, 600 10, exon
数据框 b
Sample, start, stop, event, probe, length, length/probe, region
CNV234, 2500, 3500, CN gain, 23, 235, 9, exon
CNV34, 1200, 1800, CN loss, 60, 600 10, intron
我有两个问题
首先,我想找到这两个数据帧之间的重叠,其中 CNV 的长度重叠超过 50%,并且这种重叠位于内含子区域
其次,我想知道重叠区域的长度。
我希望我的结果有一个像这样的数据框
Sample, start, stop, event, probe, length, length/probe, region, overlap, length of overlap
CNV1234, 2000, 3000, CN gain, 23, 235, 9, intron, CNV234, 500