0

我的问题如下:
data.frame在 R 中有一个包含坐标的,例如

SNP1  chr1  123456  
SNP2  chr1  156895  
SNP3  chr1  550000  
...

现在我想指定一个区域(例如 chr1:100000-500000)和多个SNPs ( n) 并找到n SNP该区域中分布最均匀的那些 s。

我有一个脚本,可以将区域分成n-1几块,然后选择最靠近这些块边界的 SNP。它还可以排除SNP被命名两次并获得下一个最接近的 s,SNP但仍然可能有更好的解决方案来选择它们均匀分布(也许通过某种方式最大化它们之间的总距离,但 s 的总数SNP非常高?)。

4

0 回答 0