问题标签 [limma]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 用于分析微阵列基因表达数据的 limma 问题 - 可能与设计矩阵有关
我对 R 相当陌生,最近开始使用它来分析一些微阵列数据。分析的总体目标是采用 DC2 并比较该人群中的 WT 与 KO 组。但是我遇到了 limma 处理的一些问题。使用 oligo 包处理数据后,我尝试创建一个设计矩阵以使用 limma 进行分析。这是我对 DC2 的 ExpressionSet 的工作流程:
这会提供如下基因列表:
但是,当我使用此代码手动检查时(仅采用第一个功能):
相同特征“17551163”的输出不同
我试图四处寻找答案,但没有运气。我假设这可能与矩阵设计有关?任何帮助将不胜感激。
谢谢
r - 解释 limma 包中的线性模型公式
这是我为线性建模函数构建设计矩阵的代码:
我不确定如何解释公式“~0”。我查找了 ?lm() 并发现如果一个公式具有隐含的截距项,则可以使用 y ~ x - 1 或 y ~ 0 + x 来删除它,但我不确定这是否是相同的情况。
r - 对每一行进行统计测试以在 R 中创建火山图?
我目前在 R 中有一个数据集,其中对于每个基因,我有四个暴露于铜的水蚤(列 2:5)和四个对照水蚤(列 6:9)的 log2 表达式。数据帧的头部如下图所示:
我希望能够创建一个说明差异表达的火山图,因此首先需要为我的每个基因生成 P 值。我考虑过进行 t 检验或 Ebayes 这样做,这是微阵列数据的最佳选择吗?如果是这样,我该如何去做,从而为第一列中的每个基因生成一个 P 值?
谢谢
r - coef 在 limma 中的含义
tl;博士
为什么fit <- eBayes(fit); topTable(fit, coef=4)
与fit <- contrasts.fit(fit, c(-1,0,0,1)); fit <- eBayes(fit); topTable(fit)
(截取设计的第 1 列)不同?
来自 limma 用户指南的示例
模型公式中的第一项是对应变的影响。这在设计矩阵中引入了一个截距列,它估计野生型未刺激细胞的平均对数表达水平,以及一个用于估计未刺激状态下突变体与野生型差异的菌株的列。模型公式中的第二项表示刺激和应变之间的相互作用。[...] 它在设计矩阵中引入了第三和第四列,分别代表了刺激对野生型和突变小鼠的影响 [...]。
我不明白的
如果 usingcoef
和看设计矩阵第 4 列和截距的差(即第 4 列和第 1 列的对比)是一样的,难道我们不需要看第 4 列和第 2 列的对比让基因对突变小鼠的刺激做出反应?
当然,我比较了使用时coef
和使用对比时的结果。它们有所不同,但我不明白为什么......显然这coef=4
并不意味着“查看第 4 列和截距之间的差异”,但那是什么意思呢?
我希望这个问题是可以理解的。提前谢谢了!
r - 使用 model.matrix 函数设计矩阵进行基因表达
需要一些帮助。我的数据如下所示:
样品 1 到 4 是正常的,5 到 10 是异常的。
数据存储在称为 DF 的数据帧中。需要使用 model.matrix 函数创建设计矩阵,其想法是使用此信息来拟合线性模型,以便能够识别差异基因。
我不知道如何创建设计矩阵。我已经阅读了文档,但它让我无处可去。该函数的语法似乎并不适合我所拥有的格式。
任何提示表示赞赏。
r - 是否可以在 limma 模型中同时分析因子和数值变量的影响?
我尝试使用 limma r 包对基因表达数据进行分析。我的模型包括因子和数值协变量,我无法同时获得这两种变量的结果。
这是一个例子:
这个对吗?还是我不应该使用对比矩阵来分析数值协变量的影响?如果我不使用该makeContrast
功能,则更难以查看因子所有级别之间的差异(我需要这样做)。因此,如果这不正确,是否还有一种方法可以定义对比以便同时进行分析的两个部分?
提前致谢!
r - 边缘 R 分析的设计矩阵?
我想比较 Q 方法和 L 方法,我考虑了 2 个不同的对比(最后),但我不确定哪个是正确的?
有 2 种不同的方法(Q 和 L),每种方法有 2 个生物复制(L4、L6-L8 和 Q3、Q5-Q7),每个生物复制有 2 个技术复制。如下:
设计
r - R中的配对线性模型
我正在寻找一种在我的 lm 模型中使用配对信息的方法。我的模型比较了配对样本的 Cancer-Normal。
我的模型:
r - 我在 log2(exprs(eSet)) 中收到此错误:数学函数的非数字参数
我使用从https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1824下载的基因表达数据集“GSE1824” 。为了开始处理这些数据,我在 R studio 上加载了所需的包:
我成功加载并解压缩了 GSE1824_RAW.tar 中的 CEL 文件,并将 CEL 文件存储在我将称为“GEMusicAR3/Cel Files”的目录中。该目录仅包含以下 CEL 文件:
我使用以下方法设置主机目录:
为了处理 CEL 文件,我运行了以下命令:
我无法找出错误的原因:
直到最近,这段代码一直运行良好,没有任何错误。
在尝试发现错误的可能原因时,我获得了以下信息:
我将非常感谢有关错误可能原因的任何提示:
先感谢您。