我发现了其他关于在 R iRanges 中通常找到重叠范围的帖子,但是你能帮我解决这个额外的小转折吗:我有两个相关的范围(一个可能的基因组重排,一个起始范围和一个结束范围),我想过滤掉母基因组中的相同范围
我发现停止和开始的范围如下(字符编号、间隔开始、间隔结束),其中左侧的 3 列显示重新排列的开始,右侧的 3 列显示重新排列的结束(它们是称为 SVDetect 的程序的输出,它使用 NGS 数据来查找与参考基因组有异常对齐的配偶对)。我有两个基因组,母亲克隆和女儿,并且想找到女儿独有的重排=我想过滤掉两个范围与另一个范围的相同行重叠的行。范围可能有点不同,但如果两个范围重叠,则强烈表明重排已经存在于母亲体内。
女儿:
1 1384138 1384862 - 1 516731 516918
2 3758860 3759278 - 2 879828 879966 # (filter away this line as overlap with below)
2 3940051 3940470 - 2 3940856 3941250
母亲:
2 3758858 3759282 - 2 879828 879966 # (overlap with this range)
1 1384138 1384862 - 3 116231 516918
2 3940051 3940470 - 3 1540856 3941250