我正在阅读一篇论文,对他们描述的 Bootstrap 方法感到困惑。文字说:
与每个堆叠通量密度相关的不确定性是通过 bootstrap 方法获得的,在此期间选择并重新堆叠源的随机子样本(有替换)。每个子样本中的源数等于堆栈中的原始源数。该过程重复 10000 次,以确定被堆叠的总体属性的代表性分布。
所以,假设我有 50 个值。我找到这些值的平均值。根据这种方法,我会从最初的 50 个总体中获取一个子样本并找到平均值,然后重复 10,000 次。现在,如果我的子样本与原始样本完全相同,因此我的平均值完全相同,这不会告诉我们什么!