我有一个基因组位置列表如下:
data = data.frame(chr = "chr17", start = 63973115, end = 64437414)
data$query = paste(gsub("chr",'',data$chr),data$start,data$end, sep = ":")
我想知道它们是CDS、5'UTR、3'UTR、内含子、ncRNA、基因间等。为此,我想使用 biomaRt 如下:
library('biomaRt')
mart <- useDataset("hsapiens_gene_ensembl", useMart("ensembl"))
res.genes <- getBM(filters = "chromosomal_region",
attributes = c("ensembl_gene_id", "external_gene_name", "description", "gene_biotype"),
values = data, mart = mart)
总结这些信息的属性是什么?我尝试使用 listAttributes() 函数,但无法确定哪一个是正确的。任何想法 ?