4

编辑:

其实我意识到我需要的是X的值。让我说清楚一点。假设我知道概率 P = 0.95,因为我想使用两个标准差。我知道范围P(-500 < x <500)这意味着我知道 y 和 z ,我也知道平均值和标准差。如果我想知道 x 的值是多少,我应该使用哪种方法。我发现一个计算器在做这样的事情,但不明白要使用哪个公式。

原始问题:

我想使用 Java 计算随机变量的正态分布概率。不确定使用哪个公式来编写代码来解决这样的问题。如果我知道平均值和标准差的值,并且想找到 x 值在 2 个特定值 y 和 z 之间的概率(P(-500

任何人都可以帮助我吗?

4

3 回答 3

14

您可以使用此处此处所讨论的错误函数org.apache.commons.math.special.Erf

附录:@Brent Worden 的答案中提出的方法大大简化了此类问题的解决方案。作为一个具体示例,下面的代码显示了如何解决您所引用的示例。此外,我发现将此处cumulativeProbability()的定义与using的实现进行比较很有帮助Erf.erf。还要注意如何 inverseCumulativeProbability()泛化所需的迭代方法。

import org.apache.commons.math.MathException;
import org.apache.commons.math.distribution.NormalDistribution;
import org.apache.commons.math.distribution.NormalDistributionImpl;

/**
 * @see http://stattrek.com/Tables/Normal.aspx#examples
 * @see https://stackoverflow.com/questions/6353678
 */
public class CumulativeProbability {

    private static NormalDistribution d;

    public static void main(String[] args) throws MathException {
        // Problem 1; µ = 1000; σ = 100
        d = new NormalDistributionImpl(1000, 100);
        System.out.println(d.cumulativeProbability(1200));
        // Problem 2; µ = 50; σ = 10
        d = new NormalDistributionImpl(50, 10);
        System.out.println(d.inverseCumulativeProbability(0.9));
    }
}

安慰:

0.9772498680518208
62.81551565546365

讨论:

问题 1. 在具有平均寿命为 1000 小时、标准偏差为 100 小时的正态分布寿命的设备中,约 97.7% 的设备将在 1200 小时内失效。

问题 2. 在具有平均 50 次重复且标准偏差为 10 次重复的正态分布技能的人中,个人可以以 63 次重复超过 90% 的人口。

于 2011-06-15T06:58:52.260 回答
8

commons-math的另一种选择是使用它的NormalDistributionImpl

    new org.apache.commons.math.distribution.NormalDistributionImpl(mean, std)
        .cumulativeProbability(a, b)

这给出了 X ~ N(mean, std) 的 P(a ≤ X ≤ b)。

从更新的问题来看,您似乎想要构建置信区间。如果是这样,请使用 inverseCumulativeProbability 方法。它计算概率 p 的值 x,使得 P(X ≤ x) = p。

于 2011-06-16T12:26:39.773 回答
4

CERN 开发的Colt库支持许多统计功能;也是 中的正态(又名高斯)分布cern.jet.random.Normal

于 2011-06-15T06:41:21.770 回答