问题标签 [limma]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
206 浏览

r - 用于分析微阵列基因表达数据的 limma 问题 - 可能与设计矩阵有关

我对 R 相当陌生,最近开始使用它来分析一些微阵列数据。分析的总体目标是采用 DC2 并比较该人群中的 WT 与 KO 组。但是我遇到了 limma 处理的一些问题。使用 oligo 包处理数据后,我尝试创建一个设计矩阵以使用 limma 进行分析。这是我对 DC2 的 ExpressionSet 的工作流程:

这会提供如下基因列表:

但是,当我使用此代码手动检查时(仅采用第一个功能):

相同特征“17551163”的输出不同

我试图四处寻找答案,但没有运气。我假设这可能与矩阵设计有关?任何帮助将不胜感激。

谢谢

0 投票
1 回答
119 浏览

r - 解释 limma 包中的线性模型公式

这是我为线性建模函数构建设计矩阵的代码:

我不确定如何解释公式“~0”。我查找了 ?lm() 并发现如果一个公式具有隐含的截距项,则可以使用 y ~ x - 1 或 y ~ 0 + x 来删除它,但我不确定这是否是相同的情况。

0 投票
1 回答
198 浏览

r - 我如何获得每个基因的每个重复的平均值?

我是 R 和编码的新手,所以这可能是一个非常明显的答案!

我有一个数据集,其中包含针对数千个基因探针的四个水蚤复制品的 log2 值,对应于各种基因(如图所示)。但是,对于每个重复,我想获得每个基因的平均表达。有没有办法我可以做到这一点?

RStudio 控制台截图

这是我的数据框的顶部:

基本上我想为每个基因(第 5 列)获取每列的平均值 - 例如,我想为每列获取前 2 行的平均值(GENE:JGI_V11_100009),并对第 5 列中的每个基因执行此操作

0 投票
0 回答
166 浏览

r - 对每一行进行统计测试以在 R 中创建火山图?

我目前在 R 中有一个数据集,其中对于每个基因,我有四个暴露于铜的水蚤(列 2:5)和四个对照水蚤(列 6:9)的 log2 表达式。数据帧的头部如下图所示:

我希望能够创建一个说明差异表达的火山图,因此首先需要为我的每个基因生成 P 值。我考虑过进行 t 检验或 Ebayes 这样做,这是微阵列数据的最佳选择吗?如果是这样,我该如何去做,从而为第一列中的每个基因生成一个 P 值?

谢谢

0 投票
1 回答
1967 浏览

r - coef 在 limma 中的含义

tl;博士

为什么fit <- eBayes(fit); topTable(fit, coef=4)fit <- contrasts.fit(fit, c(-1,0,0,1)); fit <- eBayes(fit); topTable(fit)(截取设计的第 1 列)不同?

来自 limma 用户指南的示例

模型公式中的第一项是对应变的影响。这在设计矩阵中引入了一个截距列,它估计野生型未刺激细胞的平均对数表达水平,以及一个用于估计未刺激状态下突变体与野生型差异的菌株的列。模型公式中的第二项表示刺激和应变之间的相互作用。[...] 它在设计矩阵中引入了第三和第四列,分别代表了刺激对野生型和突变小鼠的影响 [...]。

我不明白的

如果 usingcoef和看设计矩阵第 4 列和截距的差(即第 4 列和第 1 列的对比)是一样的,难道我们不需要看第 4 列和第 2 列的对比让基因对突变小鼠的刺激做出反应?

当然,我比较了使用时coef和使用对比时的结果。它们有所不同,但我不明白为什么......显然这coef=4 并不意味着“查看第 4 列和截距之间的差异”,但那是什么意思呢?

我希望这个问题是可以理解的。提前谢谢了!

0 投票
1 回答
671 浏览

r - 使用 model.matrix 函数设计矩阵进行基因表达

需要一些帮助。我的数据如下所示:

样品 1 到 4 是正常的,5 到 10 是异常的。

数据存储在称为 DF 的数据帧中。需要使用 model.matrix 函数创建设计矩阵,其想法是使用此信息来拟合线性模型,以便能够识别差异基因。

我不知道如何创建设计矩阵。我已经阅读了文档,但它让我无处可去。该函数的语法似乎并不适合我所拥有的格式。

任何提示表示赞赏。

0 投票
0 回答
61 浏览

r - 是否可以在 limma 模型中同时分析因子和数值变量的影响?

我尝试使用 limma r 包对基因表达数据进行分析。我的模型包括因子和数值协变量,我无法同时获得这两种变量的结果。

这是一个例子:

这个对吗?还是我不应该使用对比矩阵来分析数值协变量的影响?如果我不使用该makeContrast功能,则更难以查看因子所有级别之间的差异(我需要这样做)。因此,如果这不正确,是否还有一种方法可以定义对比以便同时进行分析的两个部分?

提前致谢!

0 投票
1 回答
521 浏览

r - 边缘 R 分析的设计矩阵?

我想比较 Q 方法和 L 方法,我考虑了 2 个不同的对比(最后),但我不确定哪个是正确的?

有 2 种不同的方法(Q 和 L),每种方法有 2 个生物复制(L4、L6-L8 和 Q3、Q5-Q7),每个生物复制有 2 个技术复制。如下:

设计

0 投票
0 回答
904 浏览

r - R中的配对线性模型

我正在寻找一种在我的 lm 模型中使用配对信息的方法。我的模型比较了配对样本的 Cancer-Normal。

我的模型:

0 投票
2 回答
223 浏览

r - 我在 log2(exprs(eSet)) 中收到此错误:数学函数的非数字参数

我使用从https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1824下载的基因表达数据集“GSE1824” 。为了开始处理这些数据,我在 R studio 上加载了所需的包:

我成功加载并解压缩了 GSE1824_RAW.tar 中的 CEL 文件,并将 CEL 文件存储在我将称为“GEMusicAR3/Cel Files”的目录中。该目录仅包含以下 CEL 文件:

我使用以下方法设置主机目录:

为了处理 CEL 文件,我运行了以下命令:

我无法找出错误的原因:

直到最近,这段代码一直运行良好,没有任何错误。

在尝试发现错误的可能原因时,我获得了以下信息:

我将非常感谢有关错误可能原因的任何提示:

先感谢您。