问题标签 [bioconductor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2376 浏览

r - 表达式集子集

我有一个ExpressionSet要子集的对象。例如,

我想提取一个子集,其中STATUS==0. 我试过了:

但它不起作用。

0 投票
1 回答
646 浏览

r - ESet 的子集/除 ESet

是否可以像这样对 ExpressionSet 进行子集化:

SUB=ESet[,ESet@phenoData@data$x==c(0,1)]

X 中的值是 0-9,我只想要 x=0 或 x=1 时的条目。

0 投票
1 回答
833 浏览

r - ExpressionSet (ESet) 删除带有 NA 的条目

我试图从 ESet 中排除我的所有样本,这些样本对于 10 种表型之一没有条目:

我有一个包含 50 个样本和 10 个表型的 ESet。样品 A 在表型 1 中具有 NA,在表型 3 中具有样品 B。所以我想在我的 ESet 中删除 A 和 B。

我尝试: apply(ESest@pData@data,1,function(i){if(is.na(i)){???}}

对不起,但我不知道;(

0 投票
1 回答
2650 浏览

r - 从 affyBatch 对象中提取原始数据

我有一个带有基因表达数据的 affyBatch 对象。使用没有选项的 dat <- ReadAffy() 读取数据。然后我提取我有兴趣使用的 5600 个基因,dat <- RemoveProbes(listOutProbeSets, cdfpackagename, probepackagename)

然后我使用 dat.rma <- rma(dat) 规范化表达式数据

现在我想将原始数据和 rma 标准化数据导出到 .csv 文件。检查数据我发现 exprs(dat) 的尺寸为 226576 x 30,dat.rma 的尺寸为 5600 x 30。如何提取 RAW 表达式值的 5600 x 30 矩阵?我不知道原始数据中的 226576 行是从哪里来的!

我是生物导体数据结构的初学者!很抱歉没有提供可运行的示例代码——不知道在这种情况下我会怎么做。

0 投票
1 回答
1105 浏览

rpy2 - RPy2 和 Bioconductor:基因表达示例

我正在尝试研究如何使用 Rpy2 在 Bioconductor 中进行经典的基因表达示例,但我一开始就被困住了。你如何加载数据?在 R 中,我们这样做:

在 Python 中,我们这样做:

如何做 Python 等价于:

我没有看到在扩展的文档中加载包数据的示例。我认为可能是这样,但似乎数据不属于正确的类别,因为它signature "character"在输入时具有featureNames

更新:我想我现在有了:

0 投票
1 回答
11003 浏览

r - 表达式集 - 表型数据

我必须首先说我刚刚开始使用 R 进行编程。我无法创建我的数据的表达式集。当我尝试将assaydata 和phenodata 放在一起制作表达式集时,出现错误:

validObject(.Object) 中的错误:“无效类”“ExpressionSet”“对象:assayData 和 phenoData 之间的样本名称不同”

请看一下示例数据、我制作的表型数据表和 R 程序。我想应该修改 phenodata 以使其正常工作。

请让我知道如何解决这个问题并改变 phenodata。

我的代码:

validObject(.Object) 中的错误:“无效类”“ExpressionSet”“对象:assayData 和 phenoData 之间的样本名称不同”

0 投票
1 回答
876 浏览

r - 在 R 中使用 GEOquery 和 SAM/Siggenes

由于需要,我最近开始学习 R,到目前为止,我认为非常好。但我仍处于早期阶段。然而,我在 R 中面临着这个重大的紧迫挑战,我将非常感谢一些帮助。我的编程技能显然是业余的,并且肯定会接受我能得到的任何帮助。开始:

  1. 使用 GEOquery 包创建要从 GEO 数据库中检索的数据集列表 (gdslist)
  2. 将 gdslist 项目 (gdsid) 转换为表达式数据。也就是说,可以与我的分析一起使用的数据。为此,GDS2eSet 函数可以正常工作。
  3. 以可以创建类/级别文件 (.cls) 的方式读取此转换后的表达式数据。例如,GDS3715 数据集有 3 个级别——胰岛素抵抗、胰岛素敏感和糖尿病。有时,数据集就这么简单。但在其他时候,例如在这种情况下,出于分析目的,水平将为 6,因为虽然表型上有 3 个水平,但它们已被分为治疗组和未治疗组。在这种情况下,通常会添加一个“代理”列。每个班级/级别都需要分配一个数字编号(0,1,2...)。这几乎是 .cls 文件的一般格式。
  4. 要运行 Siggenes/SAM 分析(也是 R 中的一个包),每个数据集需要两个文件:一个表达式文件(从上面 2 转换的文件)和随附的集群文件(从 3)。
  5. 为了能够在一种循环中为 gdslist 项目运行此过程,并将我的数据存储在指定的目录中。

我目前只能进入第 2 步。我认为第 3 步是挑战的关键……

非常感谢期待。

到目前为止的脚本:

0 投票
1 回答
765 浏览

r - 应用于 biostrings 包函数的 BSgenome 数据加载问题

我安装了 BSgenome 似乎工作但我无法加载库。以下代码来自 Biostrings 包

我会感谢你的帮助。你能在你的电脑上试试看这是否适合你吗?什么可能是潜在的问题。

0 投票
2 回答
5015 浏览

python - R或python中的隐马尔可夫模型实现

你知道关于如何在 python、R(Bioconductor)中实现 HMM 的任何好的文献和/或教程吗?(尤其是序列分析)

0 投票
1 回答
960 浏览

r - 基因绘图仪安装错误

我在geneplotter(Bioconductor包)安装期间。我在 Linux Mint 9 上使用 R 2.14。我认为命名空间对此负责,但我不知道如何修复它......

这是错误:

提前致谢,

N。