“bioconductor”的相关标签问题

0 投票

1 回答

1631 浏览

r - R bioconductor mzR 库加载错误

希望有人可以帮助我.. 我正在尝试按照此处的说明安装 mzmatch.R 代谢组学包：http: //mzmatch.sourceforge.net/tutorial.mzmatch.r.php

我对 R 完全陌生，所以这是我第一次做这种事情。首先，我下载了最新版本的 R 并将其安装在 Mac OSX 10.7 上。这是我运行的 R 版本：R 2.15.0 GUI 1.51 Leopard build 64-bit (6148)

然后我启动 R64.app 并键入以下命令（如上面链接中的说明中所指定）来安装包及其所有依赖项。

最后一步将始终失败并显示以下消息：

我认为这是因为无法加载库“mzR”，所以我尝试了：

果然，出现了同样的错误：

我现在很迷茫，完全不知道该怎么办。谢谢阅读！

r bioconductor

2012-06-24T22:26:51.293

0 投票

2 回答

1426 浏览

r - 代理变量分析因“下标越界”而失败

我正在尝试使用Bioconductor 的 sva 包应用代理变量分析。小插图中的示例工作正常，但是当我尝试使用真实数据时，出现“下标越界”错误irwsva.build：

试图缩小范围的尝试debug()显示fast.svd正在调用一个全零的 453 x 100 矩阵。（尺寸 453 x 100 与我的训练集相同。）这导致 aV为 100 x 0；“下标越界”错误是因为irwsva.build尝试索引到V. 我的数据一定有某些东西导致了这种行为——但是什么？

作为一种可能的解决方法，我尝试sva使用以下方法调用method="two-step"：

这有效，但我需要随后调用fsva. 那失败了，因为调用svawithmethod="two-step"导致trainSv$pprob.b为 NULL。

那么我的数据与小插图中的数据有何不同？在这两种情况下，训练和测试数据都是矩阵。在小插图中，训练矩阵为 22283 x 30；在我的例子中，它是 453 x 100。在小插图中，感兴趣的变量 ( cancer ) 是二进制的；在我的例子中，因变量可以取 12 个不同的值。

最后一个区别似乎很重要，因为如果我将范围缩小到 [0, 7]，它会起作用：

考虑到 100 个样本（列）可能不足以容纳 12 个类，我尝试了一个包含 293 个列的类似数据集。（数据来自同一个实验，但分析了 293 个单独的样本而不是 100 个处理。）它没有帮助：

如果我将 sva 限制为一次迭代，它能够运行完成，但我不知道我是否可以相信结果：

有没有人理解irwsva得足以说出为什么会发生这种情况？我能做些什么来让它在我的数据上工作吗？

r bioconductor

2012-06-28T20:54:07.450

0 投票

2 回答

922 浏览

r - 在包 GEOquery 中使用 getGEO() 时出错

我在 R 中运行以下代码：

但我收到以下错误：

谁能告诉我如何摆脱这个错误？

r bioconductor

2012-07-09T08:31:49.807

0 投票

1 回答

774 浏览

r - 在 R 中安装 ShortRead 包时出现问题 - 无法安装 RCurl 依赖项

我正在使用 Bioconductor，我想安装 ShortRead 包。我尝试了很多次，但安装依赖包 RCurl 时出错。我在 RStudio 中收到此错误：

我该怎么办？有短读的替代品吗？

谢谢 ;）

r rcurl bioconductor

2012-08-16T13:10:07.177

0 投票

2 回答

244 浏览

r - Affymetrix 自定义 CDF 分段错误

我将以下 CDF 文件用于 Brachypodium dystachion 的 Affymetrix 芯片。显然，它遵循Affymetrix CDF 规范的所有规则

http://giorgilab.org/BradiGiorgiMutwil001_txt.cdf

但是，当我尝试使用 R 和 Bioconductor 包makecdfenv 从中创建 customcdf 环境时

库(makecdfenv) make.cdf.package("BradiGiorgiMutwil001_txt.cdf",species="Brachypodium_dystachion")

我收到以下错误：

读取 CDF 文件。

* 捕获 segfault *地址 0x1，导致“内存未映射”

Traceback: 1: .Call("readCDFfile", as.character(file), as.integer(3), as.integer(compress), PACKAGE = "makecdfenv") 2: read.cdffile(file.path(path. expand(cdf.path), 文件名), compress = compress) 3: make.cdf.env(filename, cdf.path = cdf.path, compress = compress, return.env.only = FALSE) 4: make.cdf.包（“BradiGiorgiMutwil001_txt.cdf”，物种=“Brachypodium_dystachion”）

输入 CDF 文件中有什么让您觉得错误的地方吗？我完全感到困惑，因为我不知道如何解释这个分段错误，也不知道如何将其追溯到特定问题。使用affxparser Bioconductor 包时会发生类似的情况，因此它一定是 CDF 字段（而不是包）的问题。

非常感谢！:-)

费德里科

r bioconductor

2012-08-27T12:09:11.073

0 投票

0 回答

636 浏览

r - 如何在 biomart 中使用 Ensembl 的存档版本

我正在使用biomaRtR 中的包来检索基因的染色体位置。我想使用 ensemble 的存档版本来做到这一点。

根据biomaRt手册，应该

(1) 索取可用的 Ensembl 档案

(2) 加载所需的版本（本例为 Ensembl 51 小鼠基因）

当我运行最后一个命令时，出现以下错误：

出了什么问题？我怎样才能解决这个问题？

r bioconductor

2012-09-03T15:02:28.437

0 投票

1 回答

499 浏览

r - Golub 白血病数据集：与 HUGO 符号（或其他）关联的 ID

我很难将 Affy id 转换为其他一些标准符号以进行进一步处理：我正在使用的数据是白血病数据集（Golub 等人，1999 年）。我使用从 Bioconductor 项目中检索到的 golubEsets 数据集。

我尝试了本教程（http://faculty.washington.edu/kenrice/sisg/sisg-sea09-09.pdf）

这会产生很多错误，因为在数据库中找不到 Golub 数据集中的大多数 Affy id。特别是对于这个数据集，我在哪里可以找到一些标准符号（HUGO？）——因为我需要它们进行进一步的分析。

谢谢！

r generics bioinformatics bioconductor

2012-09-06T10:30:57.243

0 投票

1 回答

471 浏览

r - 寻找算法来做长的成对的核苷酸比对

我正在尝试扫描可能的SNPs并将indels支架与参考基因组的子序列对齐。（原始读数不可用）。我正在使用R/bioconductorBiostrings 包中的 `pairwiseAlignment 函数。这对于较小的脚手架工作得很好，但是当我尝试将 56kbp 脚手架与错误消息对齐时失败了：

QualityScaledXStringSet.pairwiseAlignment 中的错误（模式 = 模式，：无法分配大小为 17179869183.7 Gb 的内存块

我不确定这是否是错误？; 我的印象是Needleman-Wunsch algorithmused bypairwiseAlignment是一个O(n*m)我认为意味着计算需求在3.1E9操作顺序上的(56K * 56k ~= 3.1E9)。似乎Needleman-Wunsch相似度矩阵也应该占用 3.1 gigs 的内存。不确定我是否没有正确记住 big-o 符号，或者这实际上是在给定R scripting环境开销的情况下构建对齐所需的内存开销。

有没有人建议使用更好的对齐算法来对齐更长的序列？已经使用 BLAST 完成了初始比对，以找到要比对的参考基因组区域。我BLAST对正确放置插入缺失的可靠性并不完全有信心，而且我还没有找到与 biostrings 提供的用于解析原始 BLAST 对齐的 API 一样好的 API。

顺便说一句，这是一个复制问题的代码片段：

较短的对齐（数百个碱基）不会发生该错误。我还没有找到错误开始发生的长度截止

r alignment bioinformatics bioconductor sequence-alignment

2012-09-08T00:02:28.997

0 投票

1 回答

265 浏览

r - 如何使用名称在变量中的 R 加载和使用数据文件？

我想使用 R 在 R 中加载一个数据文件，data()数据集的名称存储在一个变量中。在没有存储在变量中的数据集名称的情况下执行此操作很简单：

但是，当数据集名称存储在变量中时，我不确定如何完成相同的任务。

data()的返回值只是加载的数据集的名称。我试图加载的数据文件位于~/R/2.15/library/ChIPpeakAnno/data/TSS.human.NCBI36.rda——我不相信它有任何特定于 Bioconductor 的东西。

谢谢！

r bioconductor

2012-09-23T00:17:34.220

0 投票

3 回答

3164 浏览

r - 在R中如何获取英文错误消息

我正在尝试一些关于生物导体的教程；但我收到错误消息，我想搜索/提交；不幸的是，由于 R 安装在以法语配置的系统上，R 以法语向我返回消息；我怎么会有这些英文信息。

我的系统：运行 gnome 3 的 Ubuntu 10.04；R 版本是最后一个 (2.15.1) Bioconductor 已更新到 2.10，

并且我尝试下载/使用数据集 GSE20986（但我在遵循“R in a nutshell”中给出的过程时遇到了另一个数据集 GSE2034 的类似错误）；对于你们这些说法语的人，我得到的错误信息是：

谢谢你的帮助。

r bioconductor

2012-09-28T15:09:31.960

问题标签 [bioconductor]

Reference