3

当我查找 a​​ffymetrix hgu133a 探针组 id 的 entrez id 时,我遇到了 biomart 包的问题。例如 biomaRt 找不到“206323_x_at”。
当我在 affy_hg_u133a 列表中列出所有探针 ID 时,只有 19872 个探针 ID,但是 HGU133a 上有 22245 个探针(或带有控制探针的 22313)。是脚本有问题还是这个数据库不完整?

谢谢!

library(biomaRt)  
mart<-useMart("ensembl", dataset="hsapiens_gene_ensembl")  
affyids="206323_x_at"  
getBM(attributes=c('affy_hg_u133a', 'entrezgene'), filters = 'affy_hg_u133a', values = affyids, mart = mart)  
[1] affy_hg_u133a entrezgene   
<0 rows> (or 0-length row.names)

hgu133a<-getBM(attributes='affy_hg_u133a', mart = mart)
dim(hgu133a)
[1] 19872     1
4

2 回答 2

1

它似乎不适用于这个探针组。我们可以得到答案

library(hgu133a.db)
myprobeset  = "206323_x_at"
genes <- mget(myprobeset,hgu133aENTREZID)

我们可以测试另一个探针组

affyids = c("218471_s_at")
getBM(attributes = c("affy_hg_u133a", "entrezgene"), filters =  "affy_hg_u133a",values = affyids, mart = ensembl)

myprobeset  = "218471_s_at"
genes <- mget(myprobeset,hgu133aENTREZID)

所以这似乎是两个不同的数据来源给出不同答案的情况。这种情况时不时发生。

于 2012-07-12T14:56:42.493 回答
0

probemapper软件包也可以用于这种特殊需要。它在 R 中可用,并且还有一个在线界面。

以下是您的特定基因的结果: qbrc.swmed.edu/probealignment/#probe=1005849

解释:供应商和 Bioconductor 同意您的探针与 Entrez ID 4983 对齐,但 BLAST 显示了一些其他潜在的对齐(如果您只关心供应商的注释,可能会忽略这些对齐)。

于 2012-07-12T16:55:51.200 回答