从几个人类单核苷酸多态性 (SNP) 开始,我如何查询所有已知 SNPS 的数据库,以便我可以生成 1000 个左右最接近的 SNPS 的列表(data.table 或 csv 文件),天气与否 SNP 是一个 tagSNP,次要等位基因频率 (MAF) 是多少,它距离起始 SNPS 有多少个碱基?
我更愿意在 R 中执行此操作(尽管不必如此)。我应该使用哪个数据库?我唯一的出发点是列出起始的 snps(例如 rs3091244 、 rs6311 等)。
我确信有一个不错的简单 Bioconductor 包可以作为我的起点。但是什么?你做过吗?我想它可以用大约 3 到 5 行代码来完成。