这听起来像是一个非常幼稚的问题,但这就是我正在做的事情,这就是为什么这让我很难过。
我有 1000 个样本,我尝试使用 R 中的以下代码对 5%、10%、15%...... 100% 进行子抽样。
subData <- replicate(30, sample(Data,55,replace=TRUE))
然后我正在计算平均值和标准差以进行进一步分析。令我困惑的是,当我选择 100% 的人口并复制 30 次时,replace=TRUE,为什么均值的标准偏差不为零?当然,如果一个人选择所有数据点 100 次并计算平均值,它应该是相同的,因此标准偏差应该是 0。我是遗漏了什么还是我在 R 中的代码做错了什么?
任何帮助将不胜感激!