问题标签 [bioconductor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 表达式集子集
我有一个ExpressionSet
要子集的对象。例如,
我想提取一个子集,其中STATUS==0
. 我试过了:
但它不起作用。
r - ESet 的子集/除 ESet
是否可以像这样对 ExpressionSet 进行子集化:
SUB=ESet[,ESet@phenoData@data$x==c(0,1)]
X 中的值是 0-9,我只想要 x=0 或 x=1 时的条目。
r - ExpressionSet (ESet) 删除带有 NA 的条目
我试图从 ESet 中排除我的所有样本,这些样本对于 10 种表型之一没有条目:
我有一个包含 50 个样本和 10 个表型的 ESet。样品 A 在表型 1 中具有 NA,在表型 3 中具有样品 B。所以我想在我的 ESet 中删除 A 和 B。
我尝试: apply(ESest@pData@data,1,function(i){if(is.na(i)){???}}
对不起,但我不知道;(
r - 从 affyBatch 对象中提取原始数据
我有一个带有基因表达数据的 affyBatch 对象。使用没有选项的 dat <- ReadAffy() 读取数据。然后我提取我有兴趣使用的 5600 个基因,dat <- RemoveProbes(listOutProbeSets, cdfpackagename, probepackagename)
然后我使用 dat.rma <- rma(dat) 规范化表达式数据
现在我想将原始数据和 rma 标准化数据导出到 .csv 文件。检查数据我发现 exprs(dat) 的尺寸为 226576 x 30,dat.rma 的尺寸为 5600 x 30。如何提取 RAW 表达式值的 5600 x 30 矩阵?我不知道原始数据中的 226576 行是从哪里来的!
我是生物导体数据结构的初学者!很抱歉没有提供可运行的示例代码——不知道在这种情况下我会怎么做。
rpy2 - RPy2 和 Bioconductor:基因表达示例
我正在尝试研究如何使用 Rpy2 在 Bioconductor 中进行经典的基因表达示例,但我一开始就被困住了。你如何加载数据?在 R 中,我们这样做:
在 Python 中,我们这样做:
如何做 Python 等价于:
我没有看到在扩展的文档中加载包数据的示例。我认为可能是这样,但似乎数据不属于正确的类别,因为它signature "character"
在输入时具有featureNames
:
更新:我想我现在有了:
r - 表达式集 - 表型数据
我必须首先说我刚刚开始使用 R 进行编程。我无法创建我的数据的表达式集。当我尝试将assaydata 和phenodata 放在一起制作表达式集时,出现错误:
validObject(.Object) 中的错误:“无效类”“ExpressionSet”“对象:assayData 和 phenoData 之间的样本名称不同”
请看一下示例数据、我制作的表型数据表和 R 程序。我想应该修改 phenodata 以使其正常工作。
请让我知道如何解决这个问题并改变 phenodata。
我的代码:
validObject(.Object) 中的错误:“无效类”“ExpressionSet”“对象:assayData 和 phenoData 之间的样本名称不同”
r - 在 R 中使用 GEOquery 和 SAM/Siggenes
由于需要,我最近开始学习 R,到目前为止,我认为非常好。但我仍处于早期阶段。然而,我在 R 中面临着这个重大的紧迫挑战,我将非常感谢一些帮助。我的编程技能显然是业余的,并且肯定会接受我能得到的任何帮助。开始:
- 使用 GEOquery 包创建要从 GEO 数据库中检索的数据集列表 (gdslist)
- 将 gdslist 项目 (gdsid) 转换为表达式数据。也就是说,可以与我的分析一起使用的数据。为此,GDS2eSet 函数可以正常工作。
- 以可以创建类/级别文件 (.cls) 的方式读取此转换后的表达式数据。例如,GDS3715 数据集有 3 个级别——胰岛素抵抗、胰岛素敏感和糖尿病。有时,数据集就这么简单。但在其他时候,例如在这种情况下,出于分析目的,水平将为 6,因为虽然表型上有 3 个水平,但它们已被分为治疗组和未治疗组。在这种情况下,通常会添加一个“代理”列。每个班级/级别都需要分配一个数字编号(0,1,2...)。这几乎是 .cls 文件的一般格式。
- 要运行 Siggenes/SAM 分析(也是 R 中的一个包),每个数据集需要两个文件:一个表达式文件(从上面 2 转换的文件)和随附的集群文件(从 3)。
- 为了能够在一种循环中为 gdslist 项目运行此过程,并将我的数据存储在指定的目录中。
我目前只能进入第 2 步。我认为第 3 步是挑战的关键……
非常感谢期待。
到目前为止的脚本:
r - 应用于 biostrings 包函数的 BSgenome 数据加载问题
我安装了 BSgenome 似乎工作但我无法加载库。以下代码来自 Biostrings 包
我会感谢你的帮助。你能在你的电脑上试试看这是否适合你吗?什么可能是潜在的问题。
python - R或python中的隐马尔可夫模型实现
你知道关于如何在 python、R(Bioconductor)中实现 HMM 的任何好的文献和/或教程吗?(尤其是序列分析)
r - 基因绘图仪安装错误
我在geneplotter(Bioconductor包)安装期间。我在 Linux Mint 9 上使用 R 2.14。我认为命名空间对此负责,但我不知道如何修复它......
这是错误:
提前致谢,
N。