r - 如何使 wilcox.test 适应我在 R 中的数据？

Question

我是 R 新手，并试图在我的数据上使用 wilcox.test：我有一个数据帧 36021X246，其行名作为探针 ID，最后一行是一个标签，指示样本属于哪个组 - 前 140 个的“控制”和“处理”为最后 106 个。

我将非常感谢在执行测试时知道如何定义这两个组......我无法在网上找到关于“公式”参数的太多信息，除了 -

“公式

一个形式为 lhs ~ rhs 的公式，其中 lhs 是一个数值变量，给出数据值，而 rhs 是一个具有两个级别的因子，给出相应的组。"

如果有人能解释 lhs~rhs 的含义以及如何定义这个公式，我将不胜感激。

谢谢！

score 1 · Accepted Answer

R 通常假设每一行都是一个案例，而列是关联变量。如果您的两个样本中的案例都出现在同一个数据框中，那么一列将是样本成员资格的指示变量。我们称之为 IndSample。Wilcoxon 是单变量检验，因此您将有另一列包含您正在测试的响应值。我们称它为 Y。然后你写

wilcox.test(y ~ IndSample, data=MyData, .....)

以及用于测试的其余参数：它是双面的吗？你想要一个准确的统计数据吗？（在你的情况下可能不是。）

在我看来，您的数据似乎就在我身边。这对数据框来说是有问题的，因为您不能像使用矩阵那样从数据框中拉出一行。

你需要抓住最后一行并将其变成一个因素 - 比如

factor(c(MyData[lastrow,]))

然后拉出包含您的回复的行：

Y <- as.numeric(c(MyData[ResponseRow,]))

然后做wilcoxon。

但是，我不确定我是否正确理解了您的情况。对于适度的 wilcoxon 测试，这似乎是一个非常大的数据矩阵。

1 回答 1