2

我有一个 DGEList x,其中包含行中的基因和列中的样本(同一患者的多个样本)。我的数据中没有 NA,因为我使用了 complete.case 函数()。我以这种方式创建设计矩阵:

design <- model.matrix(~0 + f1  + f2  + f3 + f4 + f5 + f6 + f7 + f8 + f9 + age + gender, data=x$samples)

其中 f 是一些特征(在这种情况下,我有 9 个特征)。这些只是数字向量而不是因子,因此在设计矩阵中每个特征只有一列(等于年龄)。相反,性别是一个因素(M 或 F)。所以在设计矩阵中它有 2 列。

当我打电话时:

v    <- voom(x, design, plot = F) 

它返回:

系数不可估计:f7 f8 f9 age genderF genderM
警告信息:17080 探针的部分 NA 系数我发现在传递给 model.matrix 的总值不再为 6 之前是可以的。

为什么 ??

当我调用时:vfit <- lmFit(v, design) 它返回相同的警告,并且 vift$coefficents 中对应的列 (f7 f8 f9 age genderF genderM) 仅带有 NA。

我的另一个问题是?在 model.matrix 中使用多少个参数是正确的?因为我看到在model.matrix中传递6个参数没有错误,所以没问题,但不会超过6个。当我在model.matrix()中使用超过6个值时,它会返回之前描述的问题。

4

0 回答 0