我的问题如下:
我data.frame
在 R 中有一个包含坐标的,例如
SNP1 chr1 123456
SNP2 chr1 156895
SNP3 chr1 550000
...
现在我想指定一个区域(例如 chr1:100000-500000)和多个SNP
s ( n
) 并找到n
SNP
该区域中分布最均匀的那些 s。
我有一个脚本,可以将区域分成n-1
几块,然后选择最靠近这些块边界的 SNP。它还可以排除SNP
被命名两次并获得下一个最接近的 s,SNP
但仍然可能有更好的解决方案来选择它们均匀分布(也许通过某种方式最大化它们之间的总距离,但 s 的总数SNP
非常高?)。