我有两个时间段(1999 年和 2009 年)的数据。数据分为两列,一列称为“值”(4.960001、4.847222、... 3.639985、3.849003),另一列称为“时间”(1999、1999、...、2009、2009):
每年有 75,049 个值。我想每年随机选择 30 个值(不替换)并进行配对 T 检验,然后将结果输入矩阵。我想在同一个数据集上运行该过程 1000 次以获得 T 检验值的分布。任何关于如何做到这一点的想法将不胜感激!谢谢。
我有两个时间段(1999 年和 2009 年)的数据。数据分为两列,一列称为“值”(4.960001、4.847222、... 3.639985、3.849003),另一列称为“时间”(1999、1999、...、2009、2009):
每年有 75,049 个值。我想每年随机选择 30 个值(不替换)并进行配对 T 检验,然后将结果输入矩阵。我想在同一个数据集上运行该过程 1000 次以获得 T 检验值的分布。任何关于如何做到这一点的想法将不胜感激!谢谢。
“ ....两列,一列称为“值”(4.960001、4.847222、... 3.639985、3.849003),另一列称为“时间”(1999、1999、...、2009、2009)“...”75,049每年的价值。”
听起来可以这样做:
folded <- matrix(dfrm$values, ncol=2)
replicate( 1000, { pick <- sample(1:75049, 30)
t.test(folded[pick, 1], folded[pick,2], paired=TRUE)$statistic
} )