0

我在excel中有大量数据集。我想知道这些数字是遵循Java 中的泊松分布还是二项分布。是否有任何开源库可以帮助我完成这项工作。我在看 Apache Common Math。

任何指针会有所帮助吗?

4

1 回答 1

0

听起来您有一个(相对简单的)模型拟合问题,并且您正试图在两个分布之间进行选择。您通常执行此操作的方式如下。

  1. 估计数据 p_poisson的泊松分布参数
  2. 估计 p_binomial数据二项分布的参数。
  3. 计算p(data | p_poisson)p(data | p_binomial)(似然函数)并选择具有较高概率的那个。

为了更通用,我建议查看AICBIC和有关模型选择的一般信息。在这种情况下,如果您没有大量数据,则应该对二项式分布进行轻微惩罚,因为它可能会过度拟合,因为它的参数比 Poisson 多。

于 2013-02-26T06:19:51.107 回答