问题标签 [biomart]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 尝试将 Ensembl ID 转换为 R (biomaRt) 中的基因名称
我有一个大型基因表达数据集,我正在尝试使用 RStudio 中的 biomaRt 将基因标识符转换为基因名称,但是由于某种原因,当我在我的数据帧上使用合并功能时,我的整个数据表被错误地合并/抹去。我在这里查看了以前的问题,但无论我尝试什么,我的代码似乎都无法正常工作。无限感谢!
问题从这里开始:
这是一些输出(我正在努力):
编辑:问题解决了!原来我引用getBM
错了。谢谢你们!
r - 将鼠标 Ensembl ID 转换为数据框中的基因名称
我最近使用 30 个不同的 RNA-seq 样本制作了一个无监督的层次聚类热图。x 轴标记为每个样本的名称,y 轴显示以小鼠 Ensembl ID 表示的 100 个最可变基因(例如 ENSMUSG00000020573)。
我只是想知道在我将 Ensembl ID 输入到 pheatmap() 函数之前,是否有办法用基因名称(例如 Pik3cg)替换 Ensembl ID。
我的输入表是:
我使用 colnames(mat) <- c() 手动更改了列名,但我想知道如何使用不同的函数更改行名(Ensembl ID),以便我可以在进一步的图中重现它。
我试图阅读有关使用 biomaRt 和其他软件包的信息,但似乎无法找到一种方法来做到这一点。
任何帮助将非常感激!
r - 大数据文件的循环函数ir代码
我有同样的问题查询区域内的基因,但数据很大并且产生了某些问题。我的数据就像
. . .
d<-read.table("1.txt")
我的问题是我们可以在这段代码中循环并打印基因名称吗?对于一定的运行间隔。
r - 在 R 中使用 biomart 循环
我有一个基于许多文件创建的数据集列表。
我正在尝试自动化此操作:
哪个正确使用所有数据集,但输出不正确!
我需要“合并”最终输出对于我的“my.list3”列表中的每个数据集都是唯一的,并且与原始数据集同名
有任何想法吗?
r - R biomaRt 包:获取链接数据库中的所有值
一个生物信息学编程问题。在 R 中,我有一个经典的从物种 A 到物种 B 的基因符号转换,在这个例子中是从小鼠到人类,我使用 biomaRt 执行,特别是 getLDS 函数。
但是,我想获取链接数据库中存在的所有 id:换句话说,所有鼠标/人类对(在此示例中)。告诉getLDS函数中的参数值检索所有id 的东西,而不仅仅是 x 变量中指定的那些。我说的是一张完整的地图,数万行长,指定两个数据库的符号之间的所有直系同源关系。
有什么想法或解决方法吗?非常感谢!
python - 将 bool_list 传递给 pybiomart 包中的方法
我正在使用pybiomart python包,我想使用此处提供的过滤器之一。其中一个过滤器是boolean_list类型。我不确定在使用该类型的过滤器值时如何传递参数。我通过显示以下内容的方法
知道它是boolean_list类型:dataset.list_filters()
我的查询如下:
我在这里所做的是我将a作为过滤器dic中相应过滤器的值传递。我认为我将a定义为 boolean_list (这是我的想法)。我将 a 定义为 20 个布尔值的列表,False
除了我需要的那个之外,我都做了True
。请从biomart网站的 GUI 中查看下面的屏幕截图。我想选择With Pfam ID(s)作为该过滤器的值(id_list_protein_domain_and_feature_filters)问题是当我运行该查询时,我收到以下错误:
r - 使用 biomaRt 注释染色体区域
我有一个基因组位置列表如下:
我想知道它们是CDS、5'UTR、3'UTR、内含子、ncRNA、基因间等。为此,我想使用 biomaRt 如下:
总结这些信息的属性是什么?我尝试使用 listAttributes() 函数,但无法确定哪一个是正确的。任何想法 ?
r - R 包 biomaRt 和此依赖项 RSQLite 出错
我在使用 bioconductor 安装 biomaRt 时遇到问题。我已经在带有 R 3.6 的 Rstudio 中安装了这个包而没有错误,但是在 conda 特定环境容器中使用 R 4.0,我在使用 RSQLite 时遇到了错误。
这里有这个消息:
如果有人有想法或解决方案...