问题标签 [bioconductor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R bioconductor mzR 库加载错误
希望有人可以帮助我.. 我正在尝试按照此处的说明安装 mzmatch.R 代谢组学包:http: //mzmatch.sourceforge.net/tutorial.mzmatch.r.php
我对 R 完全陌生,所以这是我第一次做这种事情。首先,我下载了最新版本的 R 并将其安装在 Mac OSX 10.7 上。这是我运行的 R 版本:R 2.15.0 GUI 1.51 Leopard build 64-bit (6148)
然后我启动 R64.app 并键入以下命令(如上面链接中的说明中所指定)来安装包及其所有依赖项。
最后一步将始终失败并显示以下消息:
我认为这是因为无法加载库“mzR”,所以我尝试了:
果然,出现了同样的错误:
我现在很迷茫,完全不知道该怎么办。谢谢阅读 !
r - 代理变量分析因“下标越界”而失败
我正在尝试使用Bioconductor 的 sva 包应用代理变量分析。小插图中的示例工作正常,但是当我尝试使用真实数据时,出现“下标越界”错误irwsva.build
:
试图缩小范围的尝试debug()
显示fast.svd
正在调用一个全零的 453 x 100 矩阵。(尺寸 453 x 100 与我的训练集相同。)这导致 aV
为 100 x 0;“下标越界”错误是因为irwsva.build
尝试索引到V
. 我的数据一定有某些东西导致了这种行为——但是什么?
作为一种可能的解决方法,我尝试sva
使用以下方法调用method="two-step"
:
这有效,但我需要随后调用fsva
. 那失败了,因为调用sva
withmethod="two-step"
导致trainSv$pprob.b
为 NULL。
那么我的数据与小插图中的数据有何不同?在这两种情况下,训练和测试数据都是矩阵。在小插图中,训练矩阵为 22283 x 30;在我的例子中,它是 453 x 100。在小插图中,感兴趣的变量 ( cancer ) 是二进制的;在我的例子中,因变量可以取 12 个不同的值。
最后一个区别似乎很重要,因为如果我将范围缩小到 [0, 7],它会起作用:
考虑到 100 个样本(列)可能不足以容纳 12 个类,我尝试了一个包含 293 个列的类似数据集。(数据来自同一个实验,但分析了 293 个单独的样本而不是 100 个处理。)它没有帮助:
如果我将 sva 限制为一次迭代,它能够运行完成,但我不知道我是否可以相信结果:
有没有人理解irwsva
得足以说出为什么会发生这种情况?我能做些什么来让它在我的数据上工作吗?
r - 在包 GEOquery 中使用 getGEO() 时出错
我在 R 中运行以下代码:
但我收到以下错误:
谁能告诉我如何摆脱这个错误?
r - 在 R 中安装 ShortRead 包时出现问题 - 无法安装 RCurl 依赖项
我正在使用 Bioconductor,我想安装 ShortRead 包。我尝试了很多次,但安装依赖包 RCurl 时出错。我在 RStudio 中收到此错误:
我该怎么办?有短读的替代品吗?
谢谢 ;)
r - Affymetrix 自定义 CDF 分段错误
我将以下 CDF 文件用于 Brachypodium dystachion 的 Affymetrix 芯片。显然,它遵循Affymetrix CDF 规范的所有规则
http://giorgilab.org/BradiGiorgiMutwil001_txt.cdf
但是,当我尝试使用 R 和 Bioconductor 包makecdfenv 从中创建 customcdf 环境时
库(makecdfenv) make.cdf.package("BradiGiorgiMutwil001_txt.cdf",species="Brachypodium_dystachion")
我收到以下错误:
读取 CDF 文件。
* 捕获 segfault *地址 0x1,导致“内存未映射”
Traceback: 1: .Call("readCDFfile", as.character(file), as.integer(3), as.integer(compress), PACKAGE = "makecdfenv") 2: read.cdffile(file.path(path. expand(cdf.path), 文件名), compress = compress) 3: make.cdf.env(filename, cdf.path = cdf.path, compress = compress, return.env.only = FALSE) 4: make.cdf.包(“BradiGiorgiMutwil001_txt.cdf”,物种=“Brachypodium_dystachion”)
输入 CDF 文件中有什么让您觉得错误的地方吗?我完全感到困惑,因为我不知道如何解释这个分段错误,也不知道如何将其追溯到特定问题。使用affxparser Bioconductor 包时会发生类似的情况,因此它一定是 CDF 字段(而不是包)的问题。
非常感谢!:-)
费德里科
r - 如何在 biomart 中使用 Ensembl 的存档版本
我正在使用biomaRt
R 中的包来检索基因的染色体位置。我想使用 ensemble 的存档版本来做到这一点。
根据biomaRt
手册,应该
(1) 索取可用的 Ensembl 档案
(2) 加载所需的版本(本例为 Ensembl 51 小鼠基因)
当我运行最后一个命令时,出现以下错误:
出了什么问题?我怎样才能解决这个问题?
r - Golub 白血病数据集:与 HUGO 符号(或其他)关联的 ID
我很难将 Affy id 转换为其他一些标准符号以进行进一步处理:我正在使用的数据是白血病数据集(Golub 等人,1999 年)。我使用从 Bioconductor 项目中检索到的 golubEsets 数据集。
我尝试了本教程(http://faculty.washington.edu/kenrice/sisg/sisg-sea09-09.pdf)
这会产生很多错误,因为在数据库中找不到 Golub 数据集中的大多数 Affy id。特别是对于这个数据集,我在哪里可以找到一些标准符号(HUGO?)——因为我需要它们进行进一步的分析。
谢谢!
r - 寻找算法来做长的成对的核苷酸比对
我正在尝试扫描可能的SNPs
并将indels
支架与参考基因组的子序列对齐。(原始读数不可用)。我正在使用R/bioconductor
Biostrings 包中的 `pairwiseAlignment 函数。这对于较小的脚手架工作得很好,但是当我尝试将 56kbp 脚手架与错误消息对齐时失败了:
QualityScaledXStringSet.pairwiseAlignment 中的错误(模式 = 模式,:无法分配大小为 17179869183.7 Gb 的内存块
我不确定这是否是错误?; 我的印象是Needleman-Wunsch algorithm
used bypairwiseAlignment
是一个O(n*m)
我认为意味着计算需求在3.1E9
操作顺序上的(56K * 56k ~= 3.1E9)
。似乎Needleman-Wunsch
相似度矩阵也应该占用 3.1 gigs 的内存。不确定我是否没有正确记住 big-o 符号,或者这实际上是在给定R scripting
环境开销的情况下构建对齐所需的内存开销。
有没有人建议使用更好的对齐算法来对齐更长的序列?已经使用 BLAST 完成了初始比对,以找到要比对的参考基因组区域。我BLAST
对正确放置插入缺失的可靠性并不完全有信心,而且我还没有找到与 biostrings 提供的用于解析原始 BLAST 对齐的 API 一样好的 API。
顺便说一句,这是一个复制问题的代码片段:
较短的对齐(数百个碱基)不会发生该错误。我还没有找到错误开始发生的长度截止
r - 如何使用名称在变量中的 R 加载和使用数据文件?
我想使用 R 在 R 中加载一个数据文件,data()
数据集的名称存储在一个变量中。在没有存储在变量中的数据集名称的情况下执行此操作很简单:
但是,当数据集名称存储在变量中时,我不确定如何完成相同的任务。
data()
的返回值只是加载的数据集的名称。我试图加载的数据文件位于~/R/2.15/library/ChIPpeakAnno/data/TSS.human.NCBI36.rda
——我不相信它有任何特定于 Bioconductor 的东西。
谢谢!
r - 在R中如何获取英文错误消息
我正在尝试一些关于生物导体的教程;但我收到错误消息,我想搜索/提交;不幸的是,由于 R 安装在以法语配置的系统上,R 以法语向我返回消息;我怎么会有这些英文信息。
我的系统:运行 gnome 3 的 Ubuntu 10.04;R 版本是最后一个 (2.15.1) Bioconductor 已更新到 2.10,
并且我尝试下载/使用数据集 GSE20986(但我在遵循“R in a nutshell”中给出的过程时遇到了另一个数据集 GSE2034 的类似错误);对于你们这些说法语的人,我得到的错误信息是:
谢谢你的帮助。