1

从几个人类单核苷酸多态性 (SNP) 开始,我如何查询所有已知 SNPS 的数据库,以便我可以生成 1000 个左右最接近的 SNPS 的列表(data.table 或 csv 文件),天气与否 SNP 是一个 tagSNP,次要等位基因频率 (MAF) 是多少,它距离起始 SNPS 有多少个碱基?

我更愿意在 R 中执行此操作(尽管不必如此)。我应该使用哪个数据库?我唯一的出发点是列出起始的 snps(例如 rs3091244 、 rs6311 等)。

我确信有一个不错的简单 Bioconductor 包可以作为我的起点。但是什么?你做过吗?我想它可以用大约 3 到 5 行代码来完成。

4

1 回答 1

0

同样,这是题外话,但您实际上可以通过 BROAD 的这个基于 Web 的工具来完成您提到的所有事情:

http://www.broadinstitute.org/mpg/snap/ldsearch.php

您只需输入一个 snp,它就会为您提供 snps 的周围窗口,您也可以导出为 csv。

祝你的遗传学项目好运!

于 2013-10-09T15:00:46.790 回答