问题标签 [bioconductor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 错误 inmatrix :非数字矩阵范围
我试图使用 Biobase 包在 R 中运行 GSA(基因集富集分析)函数:Expression Set。我使用 resp.type 是“未配对的两个类”。但是当我运行该函数时:
它给了我一个错误说:
我不知道这个错误是什么意思。我做到了mode(exprs(eset))
,它给了我“数字”
谁能告诉我如何摆脱这个问题?
r - 从蛋白质数据库到 Cosmic 或 Uniprot 的蛋白质序列比对
我想将蛋白质数据库中的 PDB 文件与 Cosmic 或 Uniprot 中显示的蛋白质的规范 AA 序列进行匹配。具体来说,我需要做的是从 pdb 文件中提取主链中的碳 α 原子及其 xyz 位置。我还需要在蛋白质序列中提取它们的实际顺序。对于结构 3GFT(Kras - Uniprot 登录号 P01116),这很简单,我可以取 ResSeq 号。然而,对于其他一些蛋白质,我不知道这是怎么可能的。
例如,对于结构 (2ZHQ)(蛋白质 F2 - Uniprot 登录号 P00734),Seqres 的 ResSeq 编号对于数字“1”和“14”重复,并且仅在 Icode 条目中有所不同。此外,icode 条目不是按字典顺序排列的,因此很难判断提取的顺序。
如果考虑结构 3V5Q(Uniprot 登录号 Q16288),情况会更糟。对于大多数蛋白质,ResSeq 编号与来自 COSMIC 或 UNIPROT 等来源的实际氨基酸相匹配。但是,在位置 711 之后,它会跳转到位置 730。当查看 REMARK 465(丢失的原子)时,它表明对于链 A,726-729 丢失了。然而,在将其与蛋白质匹配后,这些 AA 实际上是 712-715。
我附上了适用于简单 3GFT 示例的代码,但如果有人是 pdb 文件方面的专家并且可以帮助我弄清楚其余部分,我将非常感激。
r - R Bioconductor 安装错误 - 行开始 '< DOCTYPE html PUBLI ...' 格式错误
我在 R 中安装 bioconductor 包时遇到问题。这是在 MacOSX 上,全新安装的 R 2.15,并使用 bioconductor 1.4.4。成绩单如下:
我通过谷歌找到的相关问题表明存在互联网连接错误(代理等),但这里似乎并非如此。我可以很好地从 CRAN 安装软件包:(即 install.packages("foreach"))
欢迎提出建议。
r - 拉对齐字符位置
我使用成对对齐来获得以下信息:
然后我可以使用:
获取模式和主题的完整字符串序列。但是,如何从对象中获取数字 448 和 1 作为整数?我需要使用这些数字,但似乎没有办法得到它们。
r - 用于计算“突变率”的任何 R 包
我有大量的家庭数据(父母和孩子)。它们都是等位基因的形式。即每个基因座和受试者的两个等位基因。我们的问题是计算每个基因座的突变率/计数(孩子的等位基因和父母的等位基因之间的不匹配)。有没有可以轻松做到这一点的 R 包?
提前致谢
r - GenomicFeatures 软件包安装问题
很抱歉这么快就回来回答一个简单的安装问题,但我无法自己解决这个问题,这严重影响了我的工作效率。无论如何,我尝试按照 BC 网站的建议安装 GenomicFeatures。
我收到以下错误消息(除了几条警告消息)
所以我猜依赖项有一些问题,但它们会在 GF 之前自动安装似乎很奇怪。我使用的是 2.15.0 版。关于问题可能是什么的任何线索?我很乐意根据需要提供更多信息。谢谢。
r - 使用 R 将表写入文件会导致不需要的行名列
我正在尝试使用 R 将数据列合并到一个制表符分隔的矩阵中。当我使用该cbind()
函数时,R 出于某种原因添加了指定行号的第一列,即使我没有包含这样的列作为参数。例如,当我cbind()
在以下列上使用时:
x|y|z
x|y|z
x|y|z
cbind()
产生:
1|x|y|z
2|x|y|z
3|x|y|z
我尝试使用子集和 a 删除第一列我遇到的其他几种方法。无论我做什么,当我将此矩阵写入 .txt 文件时,行号仍会显示为附加列(因此在 excel 中打开时,您不仅会看到 excel 提供的行号,还会看到来自此 txt 文件的生成)。我可以在 excel 中手动删除它们,但这对于我计划生成的表的数量来说并不可行。
r - 在 2 个文件之间寻找重叠值
我有 2 个数据集,每个数据集都包含 Start、End 和 Chromosome 列名。我想比较两个文件中的值,看看是否有任何不重叠的区域(考虑到开始、结束和色度位置)并使用 R 将它们包含在列表中。什么是遍历所有文件的最佳方法两个文件中的数据点并进行比较
文件示例 1:
文件示例 2:
谢谢
file - 调用输入文件不起作用
我正在使用来自 bioconductor 的 Gviz 库。我输入了一个制表符分隔的文件,其中包含我需要在我的染色体表意文字上绘制的 CNV 位置。
我的输入文件由 dat 定义,有 4 列
- [1] 染色体
- [2] 开始
- [3] 结束
- [4] 宽度(可以是“+”或“-”,取决于拷贝数的方向)
所以我这样做了:
当我调用文件 dat 时,它显示一条错误消息:
显然我调用输入文件(在 dat 中)的方式不满足 R .. 请有人帮助我:)
r - 带 IRange 的负值
我正在使用来自 Bioconductor 的 Gviz 库,我正在尝试绘制从技术上从左到右绘制的表意文字,但我们的数据有一些负宽度,表明绘图应该从右到左。如何使用 IRanges 输入宽度的负值?
这是我们正在使用的一段代码:
谢谢 :))))