问题标签 [bioconductor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
5608 浏览

r - 错误 inmatrix :非数字矩阵范围

我试图使用 Biobase 包在 R 中运行 GSA(基因集富集分析)函数:Expression Set。我使用 resp.type 是“未配对的两个类”。但是当我运行该函数时:

它给了我一个错误说:

我不知道这个错误是什么意思。我做到了mode(exprs(eset)),它给了我“数字”

谁能告诉我如何摆脱这个问题?

0 投票
2 回答
682 浏览

r - 从蛋白质数据库到 Cosmic 或 Uniprot 的蛋白质序列比对

我想将蛋白质数据库中的 PDB 文件与 Cosmic 或 Uniprot 中显示的蛋白质的规范 AA 序列进行匹配。具体来说,我需要做的是从 pdb 文件中提取主链中的碳 α 原子及其 xyz 位置。我还需要在蛋白质序列中提取它们的实际顺序。对于结构 3GFT(Kras - Uniprot 登录号 P01116),这很简单,我可以取 ResSeq 号。然而,对于其他一些蛋白质,我不知道这是怎么可能的。

例如,对于结构 (2ZHQ)(蛋白质 F2 - Uniprot 登录号 P00734),Seqres 的 ResSeq 编号对于数字“1”和“14”重复,并且仅在 Icode 条目中有所不同。此外,icode 条目不是按字典顺序排列的,因此很难判断提取的顺序。

如果考虑结构 3V5Q(Uniprot 登录号 Q16288),情况会更糟。对于大多数蛋白质,ResSeq 编号与来自 COSMIC 或 UNIPROT 等来源的实际氨基酸相匹配。但是,在位置 711 之后,它会跳转到位置 730。当查看 REMARK 465(丢失的原子)时,它表明对于链 A,726-729 丢失了。然而,在将其与蛋白质匹配后,这些 AA 实际上是 712-715。

我附上了适用于简单 3GFT 示例的代码,但如果有人是 pdb 文件方面的专家并且可以帮助我弄清楚其余部分,我将非常感激。

0 投票
1 回答
2089 浏览

r - R Bioconductor 安装错误 - 行开始 '< DOCTYPE html PUBLI ...' 格式错误

我在 R 中安装 bioconductor 包时遇到问题。这是在 MacOSX 上,全新安装的 R 2.15,并使用 bioconductor 1.4.4。成绩单如下:

我通过谷歌找到的相关问题表明存在互联网连接错误(代理等),但这里似乎并非如此。我可以很好地从 CRAN 安装软件包:(即 install.packages("foreach"))

欢迎提出建议。

0 投票
2 回答
324 浏览

r - 拉对齐字符位置

我使用成对对齐来获得以下信息:

然后我可以使用:

获取模式和主题的完整字符串序列。但是,如何从对象中获取数字 448 和 1 作为整数?我需要使用这些数字,但似乎没有办法得到它们。

0 投票
0 回答
285 浏览

r - 用于计算“突变率”的任何 R 包

我有大量的家庭数据(父母和孩子)。它们都是等位基因的形式。即每个基因座和受试者的两个等位基因。我们的问题是计算每个基因座的突变率/计数(孩子的等位基因和父母的等位基因之间的不匹配)。有没有可以轻松做到这一点的 R 包?

提前致谢

0 投票
1 回答
5647 浏览

r - GenomicFeatures 软件包安装问题

很抱歉这么快就回来回答一个简单的安装问题,但我无法自己解决这个问题,这严重影响了我的工作效率。无论如何,我尝试按照 BC 网站的建议安装 GenomicFeatures。

我收到以下错误消息(除了几条警告消息)

所以我猜依赖项有一些问题,但它们会在 GF 之前自动安装似乎很奇怪。我使用的是 2.15.0 版。关于问题可能是什么的任何线索?我很乐意根据需要提供更多信息。谢谢。

0 投票
1 回答
4592 浏览

r - 使用 R 将表写入文件会导致不需要的行名列

我正在尝试使用 R 将数据列合并到一个制表符分隔的矩阵中。当我使用该cbind()函数时,R 出于某种原因添加了指定行号的第一列,即使我没有包含这样的列作为参数。例如,当我cbind()在以下列上使用时:

x|y|z
x|y|z
x|y|z

cbind()产生:
1|x|y|z
2|x|y|z
3|x|y|z

我尝试使用子集和 a 删除第一列我遇到的其他几种方法。无论我做什么,当我将此矩阵写入 .txt 文件时,行号仍会显示为附加列(因此在 excel 中打开时,您不仅会看到 excel 提供的行号,还会看到来自此 txt 文件的生成)。我可以在 excel 中手动删除它们,但这对于我计划生成的表的数量来说并不可行。

0 投票
0 回答
134 浏览

r - 在 2 个文件之间寻找重叠值

我有 2 个数据集,每个数据集都包含 Start、End 和 Chromosome 列名。我想比较两个文件中的值,看看是否有任何不重叠的区域(考虑到开始、结束和色度位置)并使用 R 将它们包含在列表中。什么是遍历所有文件的最佳方法两个文件中的数据点并进行比较

文件示例 1:

文件示例 2:

谢谢

0 投票
1 回答
1363 浏览

file - 调用输入文件不起作用

我正在使用来自 bioconductor 的 Gviz 库。我输入了一个制表符分隔的文件,其中包含我需要在我的染色体表意文字上绘制的 CNV 位置。

我的输入文件由 dat 定义,有 4 列

  • [1] 染色体
  • [2] 开始
  • [3] 结束
  • [4] 宽度(可以是“+”或“-”,取决于拷贝数的方向)

所以我这样做了:

当我调用文件 dat 时,它显示一条错误消息:

显然我调用输入文件(在 dat 中)的方式不满足 R .. 请有人帮助我:)

0 投票
1 回答
1354 浏览

r - 带 IRange 的负值

我正在使用来自 Bioconductor 的 Gviz 库,我正在尝试绘制从技术上从左到右绘制的表意文字,但我们的数据有一些负宽度,表明绘图应该从右到左。如何使用 IRanges 输入宽度的负值?

这是我们正在使用的一段代码:

谢谢 :))))