我想知道定义给定范围集未涵盖的所有范围的最佳方法是什么。例如,如果我有一组已知坐标的基因:
dtGenes <- fread(
"id,start,end
1,1000,1300
2,1200,1500
3,1600,2600
4,3000,4000
")
假设我知道染色体的总长度(为简单起见,假设它们都在同一条染色体上)是 10000。所以,最后我希望有以下基因间区域列表:
"startR,endR
0,1000
1500,1600
2600,3000
4000,10000
"
BioconductorIRange
在这里有用吗?还是有其他解决这个问题的好方法?