0

我的项目是关于预测生物标志物乳腺癌。

我使用这个函数给我一个 2x2 矩阵:

Table(gpl96)[1:10,1:4]

我想获取代表 GDS 中基因样本的数据并比较 p 值以了解它是否为正态分布。

4

1 回答 1

0

t.test测试两个符合正态分布的样本之间的位置是否存在差异。

为了大致检查假设的正态性,您可以检查输出是否qqnorm看起来是线性的,或者ks.test与从观察中估计参数一起使用*:

set.seed(1)
x1 <- rnorm(200,40,10) # should follow a normal distribution
ks.test(x1,"pnorm",mean=mean(x1),sd=sd(x1)) # p: 0.647 [qqnorm(x1) looks linear]
x2 <- rexp(200,10) # should *not* follow a normal distribution
ks.test(x2,"pnorm",mean=mean(x2),sd=sd(x2)) # p: 3.576e-05, [qqnorm(x2) seems curved]

我不知道 GEO 的Table,但我建议您可能想使用它的VALUE列 - 而不是任何 2x2 矩阵 - 作为t.test,qqnormks.test;的输入 也许您可以通过发布head(Table(gpl96)[1:10,1:4]).

(* 在https://stat.ethz.ch/pipermail/r-help/2003-October/040692.html之后,这似乎也证明了更精致的 Lilliefors 测试。)

于 2013-03-16T13:30:47.633 回答