0

我是 R 新手,并试图在我的数据上使用 wilcox.test:我有一个数据帧 36021X246,其行名作为探针 ID,最后一行是一个标签,指示样本属于哪个组 - 前 140 个的“控制”和“处理”为最后 106 个。

我将非常感谢在执行测试时知道如何定义这两个组......我无法在网上找到关于“公式”参数的太多信息,除了 -

“公式

一个形式为 lhs ~ rhs 的公式,其中 lhs 是一个数值变量,给出数据值,而 rhs 是一个具有两个级别的因子,给出相应的组。"

如果有人能解释 lhs~rhs 的含义以及如何定义这个公式,我将不胜感激。

谢谢!

4

1 回答 1

1

R 通常假设每一行都是一个案例,而列是关联变量。如果您的两个样本中的案例都出现在同一个数据框中,那么一列将是样本成员资格的指示变量。我们称之为 IndSample。Wilcoxon 是单变量检验,因此您将有另一列包含您正在测试的响应值。我们称它为 Y。然后你写

wilcox.test(y ~ IndSample, data=MyData, .....)

以及用于测试的其余参数:它是双面的吗?你想要一个准确的统计数据吗?(在你的情况下可能不是。)

在我看来,您的数据似乎就在我身边。这对数据框来说是有问题的,因为您不能像使用矩阵那样从数据框中拉出一行。

你需要抓住最后一行并将其变成一个因素 - 比如

factor(c(MyData[lastrow,]))

然后拉出包含您的回复的行:

Y <- as.numeric(c(MyData[ResponseRow,]))

然后做wilcoxon。

但是,我不确定我是否正确理解了您的情况。对于适度的 wilcoxon 测试,这似乎是一个非常大的数据矩阵。

于 2013-02-08T20:38:48.627 回答