-2

我有一个包含基因和 mrna 的矩阵。

ID_REF    GSM362168 GSM362169 GSM362170 GSM362171 GSM362172 GSM362173 GSM362174      
244901_at   5.171072  5.207896  5.191145  5.067809  5.010239  5.556884  4.879528      
244902_at   5.296012  5.460796  5.419633  5.440318  5.234789  7.567894  6.908795

我想使用 t 检验从矩阵中找到差异表达的基因,我进行了以下操作。

stat=mt.teststat(control,classlabel,test="t",na=.mt.naNUM,nonpara="n")   

我收到以下错误

Error in is.factor(classlabel) : object 'classlabel' not found.

我不确定如何分配分类标签。这是找到差异表达基因的正确方法吗?

类标签应该是对应于观察(列)类标签的整数向量。我不明白那是什么。

4

1 回答 1

1

如果您打开 mt.teststat 的文档:

?mt.teststat

向下滚动到最后,您将看到一个使用“Golub 数据”的示例:

data(golub)
teststat <- mt.teststat(golub, golub.cl)

如果你看一下golub.cl,就会清楚类标签向量应该是什么样子:

golub.cl
 [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1

在这种情况下,0 或 1 是两类样本的标签。向量中应该有与样本一样多的值,其顺序与样本在数据矩阵中出现的顺序相同。您还可以查看:

?golub

golub.cl:表示肿瘤类别的数字向量,27 例急性淋巴细胞白血病(ALL)病例(代码 0)和 11 例急性髓细胞白血病(AML)病例(代码 1)。

因此,您需要创建一个类似的向量,无论您为自己的数据拥有多少类,都带有标签 (0, 1, ...)。

于 2012-08-28T12:31:18.143 回答