问题标签 [biomart]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1067 浏览

r - 使用 biomart 标注位置

我有一些基因组位置,我想使用 biomaRt R 包基于 Ensembl 注释这些位置(查找 Ensembl 基因 ID、外显子、内含子等特征)。

我的部分数据

0 投票
0 回答
233 浏览

r - 在 cummeRbund 包中使用 BiomartGeneRegionTrack 时出错

我正在尝试使用 cummeRbund 包绘制感兴趣的基因。使用此脚本:

我遇到了这个错误:

使用useMart("ensembl",dataset="hsapiens_gene_ensembl")也无济于事。你能告诉我如何解决这个问题吗?

这里是sessionInfo()

0 投票
2 回答
751 浏览

r - 无法使用 biomaRt 包从 Entrez ID 获取基因符号

我正在使用以下代码从 Entrez ID 中检索基因符号:

但我收到以下错误:

0 投票
1 回答
2844 浏览

r - 如何将基因符号转换为 R 中的 Ensembl ID 和 uniprot_swissprot?

我有一个基因列表,它们的 P 值和倍数变化值作为矩阵。

我想将它们转换为 Ensembl 基因 ID 和 uniprot_swissprot。我尝试使用以下代码,但每次都出错:

getBM 中的错误(属性 = 属性,过滤器 =“hugene10stv1”,值 = 基因,:值参数不包含数据。

我试图使用这个command

但我也有错误

getBM 错误(属性 = 属性,过滤器 =“hugene10stv1”,值 = rma_final$Entrez_IDs,:无效过滤器:hugene10stv1

任何帮助将不胜感激

0 投票
1 回答
1819 浏览

r - 按基因 id 获取 SNP 列表的最佳方法?

我有一个很长的基因数据框和各种形式的 id(例如 OMIM、Ensembl、Genatlas)。我想获取与每个基因相关的所有 SNP 的列表。(这是这个问题的反面。)

到目前为止,我发现的最佳解决方案是使用biomaRt包 (bioconductor)。有一个我需要在这里进行的查找的示例。适合我的目的,这是我的代码:

这会输出一个像这样开头的数据帧:

(4612 行)

代码有效,但运行时间极长。对于上述情况,大约需要 45 秒。我想这可能与等位基因频率有关,服务器可能会即时计算。但是仅查找 SNP rs id 的最低限度需要大约 25 秒。我有几千个基因,所以这需要一整天(假设没有超时或其他错误)。这不可能。我的互联网连接并不慢(20-30 mbit)。

我尝试在每个查询中查找更多基因。这确实有帮助。一次查找 10 个基因的速度大约是查找单个基因的 10 倍。

获得与基因 ID 载体相关的 SNP 载体的最佳方法是什么?

如果我可以只下载两张表,一张带有基因及其位置,一张带有 SNP 及其位置,那么我可以使用dplyr(或者也许data.table)轻松解决这个问题。我一直找不到这样的表。

0 投票
1 回答
979 浏览

r - 如果相邻行匹配,则将一个数据框中的列名替换为另一个数据框中的行

如果该数据框中的相邻行匹配,我试图用另一个数据框中的值替换该数据框的列名。

在上面提供的示例中,我想将 df2 中的列名替换为df1$ensembl_gene_id.

nrow(df1)大于ncol(df2)并且有不匹配的值,所以我不能简单地替换colnames(df1)df1$ensembl_gene_id

这可能是一个相对简单的数据争论问题,但我似乎无法弄清楚。任何帮助,将不胜感激。

0 投票
2 回答
1513 浏览

r - 将 GENCODE ID 转换为 Ensembl - Ranged SummarizedExperiment

我有一个表达式集矩阵,其中行名是我认为是格式的 GENCODE ID,例如“ENSG00000000003.14”“ENSG00000000457.13”“ENSG00000000005.5”等等。我想将这些转换为gene_symbol,但我不确定最好的方法,特别是因为我认为是“.14”或“.13”版本。我是否应该首先修剪点后的所有 ID,然后使用 biomaRt 进行转换?如果是这样,最有效的方法是什么?有没有更好的方法来获取gene_symbol?

非常感谢你的帮助

0 投票
1 回答
893 浏览

r - biomaRt R包中如何使用NCBI基因数据库

我不是 R 方面的专家,但我正在尝试学习如何使用 biomaRt 包来查找位于我感兴趣的区域的基因。

我已经设法使用带有以下代码的 ensembl 数据集生成有效的输出:

我知道“entrezgene”对应于 NCBI 基因 ID,但我想从 NCBI 获得基因名称。

有没有办法使用连接到 NCBI 数据库的 biomaRt 并检索该信息?

提前谢谢你。

0 投票
1 回答
2138 浏览

r - 从基因符号和 ID 获取基因位置

我想从基因符号(例如:TTN)和基因 ID(例如:ENSG00000155657)中获取人类基因组的基因位置。我想用biomaRtR 包来做。我该怎么做?

0 投票
1 回答
141 浏览

r - 在 biomaRt 中检索 SNP 位置,命令挂起

我试图检索有关 SNP 位置的信息。我尝试按照本网站的答案说明进行操作,但该命令不再起作用:

等待很长时间后出现以下错误:

自上一个版本以来,biomaRt 命令有什么变化吗?还是我做错了什么?