问题标签 [bioconductor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
3204 浏览

r - 转换/更新表中基因 ID 的最快方法?

注意:我不是在问特定于 Bioconductor 的问题,而是在示例代码中需要 Bioconductor。请忍受我。

你好,

我有许多制表符分隔的文件,其中包含有关特定基因的各种类型的信息。一列或多列可以是我需要升级到最新基因符号注释的基因符号的别名。

我正在使用 Bioconductor 的 org.Hs.eg.db 库来执行此操作(特别是 org.Hs.egALIAS2EG 和 org.Hs.egSYMBOL 对象)。

报告的代码可以完成这项工作,但速度很慢,我猜是因为嵌套的 for 循环在每次迭代时查询 org.Hs.eg.db 数据库。是否有更快/更简单/更智能的方法来实现相同的结果?

我正在考虑使用其中一个 apply 函数,但请记住 org.Hs.egALIAS2EG 和 org.Hs.egSYMBOL 是对象,而不是函数。

谢谢!

0 投票
0 回答
688 浏览

r - R Bioconductor 找不到 ChipDb 类的 keys() 函数

您好 Bioconductor 用户,

我正在玩 ChipDb 类,特别是 illuminaHumanv4.db 包。我只是尝试使用 select() 方法从该数据库创建一个注释表,如帮助部分中所述。

我相信唯一需要测试的库是

cols() 函数工作正常

keytypes() 函数也可以正常工作

但是,当我运行 keys() 函数时,出现以下错误

根据文档,ChipDb 类应该从 AnnotationDb 类继承这个函数。当我尝试运行 select() 函数时,这会导致错误,因为要传递的参数之一是由 keys() 函数生成的。

我已经更新了我的环境(R 3.0.1,bioconductor 2.12)和我所有的包,这是我的 sessionInfo()

让我知道最近是否有人遇到过同样的问题。

谢谢!

0 投票
0 回答
159 浏览

r - 生物导体封装使用R2013

我无法安装包useR2013,我尝试了 bioconductor 网站上所有可能的命令,但什么也没有。我一直从 R 那里得到同样的信息。你能给点建议吗?

输出sessionInfo()

或者

0 投票
2 回答
1872 浏览

r - 如何使用matchpattern()在R中具有许多序列(.fasta)的文件中查找某些氨基酸

我有一个文件(mydata.txt),其中包含许多fasta格式的外显子序列。我想为每个 DNA 序列(考虑框架)找到开始('atg')和停止('taa','tga','tag')密码子。我尝试使用matchPattern(来自BiostringsR 包的函数)来查找这些氨基酸:

例如 mydata.txt 可以是:

注意:read.fasta 是seqinr包中用于导入 fasta 格式文件的函数。

但是这个命令不起作用!如何使用此功能查找每个外显子序列中的起始和终止密码子?(不移帧)

0 投票
1 回答
46196 浏览

r - R 中热图/聚类默认值的差异(热图与热图.2)?

我正在比较两种在 R 中使用树状图创建热图的方法,一种是made4's heatplot,另一种是gplotsof heatmap.2。适当的结果取决于分析,但我试图理解为什么默认值如此不同,以及如何让两个函数给出相同的结果(或高度相似的结果),以便我理解所有的“黑盒”参数进入这个。

这是示例数据和包:

用 heatmap.2 对数据进行聚类给出:

在此处输入图像描述

使用heatplot给出:

在此处输入图像描述

最初的结果和缩放比例非常不同。heatplot在这种情况下,结果看起来更合理,所以我想了解要输入哪些参数heatmap.2才能让它做同样的事情,heatmap.2因为我想使用其他优点/功能,因为我想了解缺少的成分。

heatplot使用具有相关距离的平均链接,因此我们可以将其输入heatmap.2以确保使用类似的聚类(基于:https ://stat.ethz.ch/pipermail/bioconductor/2010-August/034757.html )

导致: 在此处输入图像描述

这使得行侧树状图看起来更相似,但列仍然不同,尺度也是如此。似乎heatplot默认情况下以某种方式缩放列,默认情况下heatmap.2不会这样做。如果我向 heatmap.2 添加行缩放,我得到:

在此处输入图像描述

这仍然不相同,但更接近。我怎样才能重现heatplot's 结果heatmap.2?有什么区别?

edit2:似乎一个关键的区别是heatplot用行和列重新调整数据,使用:

这就是我要导入到我对heatmap.2. 我喜欢它的原因是因为它使低值和高值之间的对比度更大,而只是传递zlimheatmap.2被简单地忽略了。如何在保留沿列的聚类的同时使用这种“双重缩放”?我想要的只是增加对比度:

heatplot(..., dualScale=TRUE, scale="none")

与您获得的低对比度相比:

heatplot(..., dualScale=FALSE, scale="row")

对此有什么想法吗?

0 投票
1 回答
3434 浏览

r - 不加载包的R函数调用

我想使用 Bioconductor 包中的函数hypergraph而不hyperdraw加载包。hyperdraw从小插图运行示例时

我得到错误:

如果我尝试加载hyperedges

我得到错误

library当我使用or加载两个包时,我没有收到错误(在没有andrequire的情况下运行上述代码)。hypergraph::hyperdraw::

我不想加载包的原因是因为我正在构建一个只在一个函数中使用hyperdraw和的包,hypergraph我宁愿将这些包放入而Suggests不是放入Depends我的DESCRPTION文件中。

有谁知道如何解决这个问题?

0 投票
1 回答
587 浏览

r - 如何使用免费软件从微阵列 Gene Pix 数据计算贝叶斯网络?

我尝试使用 MeV26、Bayesia 软件和 R 从 26 列基因表达微阵列编号(.csv 文件,那里有 652 个基因)制作贝叶斯网络。有经验的人可以建议使用哪些软件和脚本以及哪些书籍和教程最适合该任务?是否有任何 Python 或 Ruby 库可以做到这一点?

谢谢

0 投票
0 回答
1108 浏览

r - 将 Affymetrix (*_at) Mouse Probe ID 转换为 R 中的 HUGO 基因符号

我有以下探针列表(来自鼠标),

更长的列表可以在这里找到:http: //dpaste.com/1371949/plain/

我想要做的是使用 R 将该名称与基因符号转换。有什么方法可以做到这一点?

我试过这个但失败了

更新:我试过 BioMart 但无济于事:

它改为打印 Ensembl 基因 id (egENSMUSG00000057666)

0 投票
1 回答
224 浏览

r - time/window/ts/seqselect中的start和end参数

我是 r 的新手,如果作为向量提供,我很难理解 start 和 end 参数是如何工作的。考虑代码:

这将返回一个向量,其中包含位置 6 到 10 的整数。现在:

返回值 6-10 与 1-5 的值连接。为什么呢?start/end 中向量的第二个值有什么作用?示例来自:IRanges 概述第 2 页

0 投票
2 回答
550 浏览

r - 使用 sapply 聚合列逗号分隔值

dA 有这样的数据表

我想要实现的是EndPoint - StartPoint在特定组中获得长度()的 SUM/MEAN/等,但不能与 sapply 一起使用

我的目标是得到表格的结果:

我正在尝试将两件事结合起来

但我被困住了,无法让它工作。

添加样本数据