问题标签 [biomart]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
961 浏览

r - 尝试将 Ensembl ID 转换为 R (biomaRt) 中的基因名称

我有一个大型基因表达数据集,我正在尝试使用 RStudio 中的 biomaRt 将基因标识符转换为基因名称,但是由于某种原因,当我在我的数据帧上使用合并功能时,我的整个数据表被错误地合并/抹去。我在这里查看了以前的问题,但无论我尝试什么,我的代码似乎都无法正常工作。无限感谢!

问题从这里开始:

这是一些输出(我正在努力):

编辑:问题解决了!原来我引用getBM错了。谢谢你们!

0 投票
1 回答
441 浏览

r - 将鼠标 Ensembl ID 转换为数据框中的基因名称

我最近使用 30 个不同的 RNA-seq 样本制作了一个无监督的层次聚类热图。x 轴标记为每个样本的名称,y 轴显示以小鼠 Ensembl ID 表示的 100 个最可变基因(例如 ENSMUSG00000020573)。

我只是想知道在我将 Ensembl ID 输入到 pheatmap() 函数之前,是否有办法用基因名称(例如 Pik3cg)替换 Ensembl ID。

我的输入表是:

我使用 colnames(mat) <- c() 手动更改了列名,但我想知道如何使用不同的函数更改行名(Ensembl ID),以便我可以在进一步的图中重现它。

我试图阅读有关使用 biomaRt 和其他软件包的信息,但似乎无法找到一种方法来做到这一点。

任何帮助将非常感激!

0 投票
1 回答
60 浏览

r - 大数据文件的循环函数ir代码

我有同样的问题查询区域内的基因,但数据很大并且产生了某些问题。我的数据就像

. . .

d<-read.table("1.txt")

我的问题是我们可以在这段代码中循环并打印基因名称吗?对于一定的运行间隔。

0 投票
1 回答
164 浏览

r - 在 Ubuntu 20.04 上安装 biomaRt R 包时出现 CURL_OPENSSL_3 问题

问题

我正在尝试安装biomaRtR 包,但一直遇到问题。我还注意到,同样的问题也出现在其他一些包上,比如twitteR. 这似乎是一个与curl.

当我在下面运行以下安装命令时:

我收到以下错误消息:

问题

你经历过类似的事情吗?如果是这样,您是如何解决的?

尝试解决

  1. 尝试安装此处RCurl提到的软件包,但没有帮助。

  2. 尝试libcurl3按照此处所述安装。但是,它破坏了 R 安装。

  3. 尝试重新安装 R。

以上都不适合我。

R会话信息

0 投票
1 回答
52 浏览

r - 在 R 中使用 biomart 循环

我有一个基于许多文件创建的数据集列表。

我正在尝试自动化此操作:

哪个正确使用所有数据集,但输出不正确!

我需要“合并”最终输出对于我的“my.list3”列表中的每个数据集都是唯一的,并且与原始数据集同名

有任何想法吗?

0 投票
1 回答
31 浏览

r - R biomaRt 包:获取链接数据库中的所有值

一个生物信息学编程问题。在 R 中,我有一个经典的从物种 A 到物种 B 的基因符号转换,在这个例子中是从小鼠到人类,我使用 biomaRt 执行,特别是 getLDS 函数。

但是,我想获取链接数据库中存在的所有 id:换句话说,所有鼠标/人类对(在此示例中)。告诉getLDS函数中的参数检索所有id 的东西,而不仅仅是 x 变量中指定的那些。我说的是一张完整的地图,数万行长,指定两个数据库的符号之间的所有直系同源关系。

有什么想法或解决方法吗?非常感谢!

0 投票
0 回答
23 浏览

python - 将 bool_list 传递给 pybiomart 包中的方法

我正在使用pybiomart python,我想使用此处提供的过滤器之一。其中一个过滤器是boolean_list类型。我不确定在使用该类型的过滤器值时如何传递参数。我通过显示以下内容的方法 知道它是boolean_list类型:dataset.list_filters()在此处输入图像描述

我的查询如下:

我在这里所做的是我将a作为过滤dic中相应过滤器的值传递。我认为我将a定义为 boolean_list (这是我的想法)。我将 a 定义为 20 个布尔值的列表,False除了我需要的那个之外,我都做了True请从biomart网站的 GUI 中查看下面的屏幕截图。我想选择With Pfam ID(s)作为该过滤器的值(id_list_protein_domain_and_feature_filters)问题是当我运行该查询时,我收到以下错误:

我要做的基本上是选择组合框中的一项(如下面来自 biomart 网站 GUI 的屏幕截图)提前谢谢。 我想通过 pybiomart 包执行的 GUI 过滤器选择示例

0 投票
0 回答
23 浏览

r - 使用 biomaRt 注释染色体区域

我有一个基因组位置列表如下:

我想知道它们是CDS、5'UTR、3'UTR、内含子、ncRNA、基因间等。为此,我想使用 biomaRt 如下:

总结这些信息的属性是什么?我尝试使用 listAttributes() 函数,但无法确定哪一个是正确的。任何想法 ?

0 投票
3 回答
1790 浏览

r - R 包 biomaRt 和此依赖项 RSQLite 出错

我在使用 bioconductor 安装 biomaRt 时遇到问题。我已经在带有 R 3.6 的 Rstudio 中安装了这个包而没有错误,但是在 conda 特定环境容器中使用 R 4.0,我在使用 RSQLite 时遇到了错误。

这里有这个消息:

如果有人有想法或解决方案...

0 投票
0 回答
29 浏览

r - biomart 为一个基因返回多个 ensembl id

我必须将我的 scRNA-seq 数据中的基因名称转换为集成 ID 以进行下游分析。我使用了 biomaRt 包,它转换了一些基因名称:

但是,它会为一个基因返回几个 ensemble id,如下所示:

在此处输入图像描述

在这种情况下,我应该指定基因位置还是染色体编号?