问题标签 [bioconductor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1631 浏览

r - R bioconductor mzR 库加载错误

希望有人可以帮助我.. 我正在尝试按照此处的说明安装 mzmatch.R 代谢组学包:http: //mzmatch.sourceforge.net/tutorial.mzmatch.r.php

我对 R 完全陌生,所以这是我第一次做这种事情。首先,我下载了最新版本的 R 并将其安装在 Mac OSX 10.7 上。这是我运行的 R 版本:R 2.15.0 GUI 1.51 Leopard build 64-bit (6148)

然后我启动 R64.app 并键入以下命令(如上面链接中的说明中所指定)来安装包及其所有依赖项。

最后一步将始终失败并显示以下消息:

我认为这是因为无法加载库“mzR”,所以我尝试了:

果然,出现了同样的错误:

我现在很迷茫,完全不知道该怎么办。谢谢阅读 !

0 投票
2 回答
1426 浏览

r - 代理变量分析因“下标越界”而失败

我正在尝试使用Bioconductor 的 sva 包应用代理变量分析。小插图中的示例工作正常,但是当我尝试使用真实数据时,出现“下标越界”错误irwsva.build

试图缩小范围的尝试debug()显示fast.svd正在调用一个全零的 453 x 100 矩阵。(尺寸 453 x 100 与我的训练集相同。)这导致 aV为 100 x 0;“下标越界”错误是因为irwsva.build尝试索引到V. 我的数据一定有某些东西导致了这种行为——但是什么?

作为一种可能的解决方法,我尝试sva使用以下方法调用method="two-step"

这有效,但我需要随后调用fsva. 那失败了,因为调用svawithmethod="two-step"导致trainSv$pprob.b为 NULL。

那么我的数据与小插图中的数据有何不同?在这两种情况下,训练和测试数据都是矩阵。在小插图中,训练矩阵为 22283 x 30;在我的例子中,它是 453 x 100。在小插图中,感兴趣的变量 ( cancer ) 是二进制的;在我的例子中,因变量可以取 12 个不同的值。

最后一个区别似乎很重要,因为如果我将范围缩小到 [0, 7],它会起作用:

考虑到 100 个样本(列)可能不足以容纳 12 个类,我尝试了一个包含 293 个列的类似数据集。(数据来自同一个实验,但分析了 293 个单独的样本而不是 100 个处理。)它没有帮助:

如果我将 sva 限制为一次迭代,它能够运行完成,但我不知道我是否可以相信结果:

有没有人理解irwsva得足以说出为什么会发生这种情况?我能做些什么来让它在我的数据上工作吗?

0 投票
2 回答
922 浏览

r - 在包 GEOquery 中使用 getGEO() 时出错

我在 R 中运行以下代码:

但我收到以下错误:

谁能告诉我如何摆脱这个错误?

0 投票
1 回答
774 浏览

r - 在 R 中安装 ShortRead 包时出现问题 - 无法安装 RCurl 依赖项

我正在使用 Bioconductor,我想安装 ShortRead 包。我尝试了很多次,但安装依赖包 RCurl 时出错。我在 RStudio 中收到此错误:

我该怎么办?有短读的替代品吗?

谢谢 ;)

0 投票
2 回答
244 浏览

r - Affymetrix 自定义 CDF 分段错误

我将以下 CDF 文件用于 Brachypodium dystachion 的 Affymetrix 芯片。显然,它遵循Affymetrix CDF 规范的所有规则

http://giorgilab.org/BradiGiorgiMutwil001_txt.cdf

但是,当我尝试使用 R 和 Bioconductor 包makecdfenv 从中创建 customcdf 环境时

库(makecdfenv) make.cdf.package("BradiGiorgiMutwil001_txt.cdf",species="Brachypodium_dystachion")

我收到以下错误:

读取 CDF 文件。

* 捕获 segfault *地址 0x1,导致“内存未映射”

Traceback: 1: .Call("readCDFfile", as.character(file), as.integer(3), as.integer(compress), PACKAGE = "makecdfenv") 2: read.cdffile(file.path(path. expand(cdf.path), 文件名), compress = compress) 3: make.cdf.env(filename, cdf.path = cdf.path, compress = compress, return.env.only = FALSE) 4: make.cdf.包(“BradiGiorgiMutwil001_txt.cdf”,物种=“Brachypodium_dystachion”)

输入 CDF 文件中有什么让您觉得错误的地方吗?我完全感到困惑,因为我不知道如何解释这个分段错误,也不知道如何将其追溯到特定问题。使用affxparser Bioconductor 包时会发生类似的情况,因此它一定是 CDF 字段(而不是包)的问题。

非常感谢!:-)

费德里科

0 投票
0 回答
636 浏览

r - 如何在 biomart 中使用 Ensembl 的存档版本

我正在使用biomaRtR 中的包来检索基因的染色体位置。我想使用 ensemble 的存档版本来做到这一点。

根据biomaRt手册,应该

(1) 索取可用的 Ensembl 档案

(2) 加载所需的版本(本例为 Ensembl 51 小鼠基因)

当我运行最后一个命令时,出现以下错误:

出了什么问题?我怎样才能解决这个问题?

0 投票
1 回答
499 浏览

r - Golub 白血病数据集:与 HUGO 符号(或其他)关联的 ID

我很难将 Affy id 转换为其他一些标准符号以进行进一步处理:我正在使用的数据是白血病数据集(Golub 等人,1999 年)。我使用从 Bioconductor 项目中检索到的 golubEsets 数据集。

我尝试了本教程(http://faculty.washington.edu/kenrice/sisg/sisg-sea09-09.pdf)

这会产生很多错误,因为在数据库中找不到 Golub 数据集中的大多数 Affy id。特别是对于这个数据集,我在哪里可以找到一些标准符号(HUGO?)——因为我需要它们进行进一步的分析。

谢谢!

0 投票
1 回答
471 浏览

r - 寻找算法来做长的成对的核苷酸比对

我正在尝试扫描可能的SNPs并将indels支架与参考基因组的子序列对齐。(原始读数不可用)。我正在使用R/bioconductorBiostrings 包中的 `pairwiseAlignment 函数。这对于较小的脚手架工作得很好,但是当我尝试将 56kbp 脚手架与错误消息对齐时失败了:

QualityScaledXStringSet.pairwiseAlignment 中的错误(模式 = 模式,:无法分配大小为 17179869183.7 Gb 的内存块

我不确定这是否是错误?; 我的印象是Needleman-Wunsch algorithmused bypairwiseAlignment是一个O(n*m)我认为意味着计算需求在3.1E9操作顺序上的(56K * 56k ~= 3.1E9)。似乎Needleman-Wunsch相似度矩阵也应该占用 3.1 gigs 的内存。不确定我是否没有正确记住 big-o 符号,或者这实际上是在给定R scripting环境开销的情况下构建对齐所需的内存开销。

有没有人建议使用更好的对齐算法来对齐更长的序列?已经使用 BLAST 完成了初始比对,以找到要比对的参考基因组区域。我BLAST对正确放置插入缺失的可靠性并不完全有信心,而且我还没有找到与 biostrings 提供的用于解析原始 BLAST 对齐的 API 一样好的 API。

顺便说一句,这是一个复制问题的代码片段:

较短的对齐(数百个碱基)不会发生该错误。我还没有找到错误开始发生的长度截止

0 投票
1 回答
265 浏览

r - 如何使用名称在变量中的 R 加载和使用数据文件?

我想使用 R 在 R 中加载一个数据文件,data()数据集的名称存储在一个变量中。在没有存储在变量中的数据集名称的情况下执行此操作很简单:

但是,当数据集名称存储在变量中时,我不确定如何完成相同的任务。

data()的返回值只是加载的数据集的名称。我试图加载的数据文件位于~/R/2.15/library/ChIPpeakAnno/data/TSS.human.NCBI36.rda——我不相信它有任何特定于 Bioconductor 的东西。

谢谢!

0 投票
3 回答
3164 浏览

r - 在R中如何获取英文错误消息

我正在尝试一些关于生物导体的教程;但我收到错误消息,我想搜索/提交;不幸的是,由于 R 安装在以法语配置的系统上,R 以法语向我返回消息;我怎么会有这些英文信息。

我的系统:运行 gnome 3 的 Ubuntu 10.04;R 版本是最后一个 (2.15.1) Bioconductor 已更新到 2.10,

并且我尝试下载/使用数据集 GSE20986(但我在遵循“R in a nutshell”中给出的过程时遇到了另一个数据集 GSE2034 的类似错误);对于你们这些说法语的人,我得到的错误信息是:

谢谢你的帮助。