1

我在下面有一部分数据(数据集)。它总结了用不同药物处理细胞后的细胞活力(实际数据集有 1200 种药物)。实验一式三份进行(样品 1、2 和 3)。为了简单起见,我在下面生成了一个小数据集:

             sample_01        sample02         sample03
untreated    100                120                110
drug1         50                 49                48
drug2         90                 87               80
drug3          40                43               42

我想在测试中比较未经处理的细胞活力值与我使用的每种药物。

我尝试使用 for 循环,但它不起作用:

for (i in 1:nrow(dataset)) {
   x = dataset["untreated",]
   y = dataset[i,]
   result<-t.test(x,y)
}
4

1 回答 1

0

这是您帖子中的数据集示例:

dataset <- data.frame(sample_01=c(100,50,90,40),
                      sample_02=c(120,49,87,43),
                      sample_02=c(110,48,80,42)
                      )
rownames(dataset) <- c("untreated", "drug1", "drug2", "drug3")

您的循环似乎很好,只需要两个修改:

2首先,您应该从而不是从开始循环,1因为您不想将第一行与自身进行比较(未经处理)。

第二,你应该将你的结果存储在一个列表中,而不是覆盖一个名为“results”的变量,因为这样你每次都会在循环中重写它,最后只会得到最后一行的答案。

以下是修改:

results <- list()
for (i in 2:nrow(dataset)) {
  x <- dataset["untreated",]
  y <- dataset[i,]
  results[[i-1]] <- t.test(x,y)
}

现在您可以获得 p 值:

> sapply(results, getElement, "p.value")
[1] 0.008337497 0.033407617 0.006107201

或者,为了让事情变得更容易,您可以考虑使用一个包:

library(matrixTests)
> row_t_welch(dataset[-1,], dataset["untreated",])
      obs.x obs.y obs.tot   mean.x mean.y mean.diff     var.x var.y   stderr       df  statistic      pvalue  conf.low  conf.high alternative mean.null conf.level
drug1     3     3       6 49.00000    110 -61.00000  1.000000   100 5.802298 2.039996 -10.513075 0.008337497 -85.50204 -36.497961   two.sided         0       0.95
drug2     3     3       6 85.66667    110 -24.33333 26.333333   100 6.489307 2.985027  -3.749758 0.033407617 -45.04393  -3.622734   two.sided         0       0.95
drug3     3     3       6 41.66667    110 -68.33333  2.333333   100 5.840472 2.093283 -11.699968 0.006107201 -92.41964 -44.247023   two.sided         0       0.95
于 2018-06-08T12:38:13.403 回答