0

我已经将混合分布拟合到多模态生物测量数据中,以便相应地对个体进行分组(画出长度测量的多模态直方图;假设每种模式代表不同的年龄组,我可以从容易测量的长度数据中推断出年龄数字) .

混合分布为每个人在每种模式下的成员资格提供后验概率,因此一旦按长度类别分箱,一行数据可能如下所示:

   l.class freq age1  age2  age3  age5
       9   41    0.2  0.25   0.3  0.25

其中 l.class 是长度 bin,freq 是个体数量,age1、age2、age3 和 age5 是与给定混合模式/年龄组的关联概率。由于这些是概率而不是比例,因此我想对每个条目进行多次迭代,以便估计每个长度箱的年龄数字。

我曾尝试sample()在 R 中实现这一点,但无法根据概率将分类归类为多个潜在组之一。

4

1 回答 1

0
x <- sample(names(data1)[3:ncol(data1)], data1$freq, replace=T, prob=c(data1[i,3:ncol(data1)]))

这是我最终使用的方法。我想在循环中运行采样,以便按概率采样多次(即 1000 次),所以我这样做了,然后将每个年龄段的平均样本数作为我的估计。

于 2014-06-01T20:40:02.153 回答