1

有谁知道将单核苷酸多态性 (SNP) ID 从 rs# 转换为 SNP_A-# 的方法?我有两个 SNP,rs429358 和 rs4420638,需要确定这些 SNP 是否包含在不同的数据集中。数据集使用 SNP_A-xxxxx 符号作为 SNP ID。任何帮助将不胜感激!

4

3 回答 3

2

你应该问biostar: http: //www.biostars.org/show/questions/

SNP_A### 不是官方命名法。它从何而来 ?

比较您的 ID 的唯一方法是比较染色体/位置/等位基因参考/等位基因替代。

于 2012-08-20T23:09:50.307 回答
1

SNP_A### 标识符很可能是 Affymetrix SNP id。您需要知道它们来自哪个阵列,但它可能是人类全基因组 SNP 6.0。

您可以从 Affymetrix 网站下载注释数据,该网站将提供 rs# 到 affyid# 的映射。尝试从:http ://www.affymetrix.com/support/mas/index.affx#1_1

为 Genomewide SNP 6.0 阵列产品选择“软件和数据”下的“注释文件”。

一个问题是阵列上的一些探针集是多余的 - 对于一个小子集,您将有多个 affyid# 映射到一个 rsid#

于 2012-08-21T13:38:25.267 回答
0

SNP_A* 标识符是 Affymetrix SNP ID。我也必须做类似的事情,但规模要大得多......从这里使用 Affymetrix 注释文件“Genomewide SNP 6.0”并没有像我想要的那样映射:http://www.affymetrix。 com/support/mas/index.affx#1_1

我所做的是使用 Biopython(我是在 Python3 中完成的)。首先,您必须通过 pip安装biopython 。

完成此操作后,您可以使用 Entrez 库来使用 esearch() 方法。这是一些示例代码:

from Bio import Entrez

Entrez.email = '<email address>'
handle = Entrez.esearch(db='snp', retmax='1', sort='SNP_ID', term='<affymetrix id>')
results = Entrez.read(handle)
rsNumber = 'rs'+results['IdList'][0]

这应该为您提供来自 affymetrix id 的正确 rs 编号。

于 2015-03-16T19:07:22.533 回答