5

我有一个非常基本的问题。正态概率图的基础是什么,即概率代表什么?我正在测试标准正态分布。我的normplot(在 MATLAB 中)显示这些值或多或少在一条直线上,但 0.5 的概率对应于一个非零值。

我的问题是,我该如何解释这个?这是否意味着我的数据是正态分布但具有非零均值(即不是标准正态),还是这个概率仅反映其他东西?我试过谷歌,一个链接说概率是 z 表的累积概率,我不知道该怎么做。

同样在 MATLAB 中,只要这些值符合程序绘制的线(红色虚线),这些值是否来自正态分布?在我的一张图中,虚线非常陡峭,但值适合,这是否意味着在这条线之外的一两个值只是异常值?

我对统计很陌生,所以请帮忙!

谢谢!

4

2 回答 2

2

我的问题是,我该如何解释这个?这是否意味着我的数据是正态分布但具有非零均值(即不是标准正态),还是这个概率仅反映其他东西?

你是对的。如果您运行 normplot 并获得非常接近拟合线的数据,这意味着您的数据具有非常接近正态分布的累积分布函数。0.5 CDF 点对应于拟合正态分布的平均值。(在您的情况下看起来大约为 0.002)

你得到一条直线的原因是 y 轴是非线性的,并且它被“扭曲”,使得完美的高斯累积分布映射成一条线:y 轴标记与逆是线性的误差函数

当您查看末端时,它们的斜率比拟合线更陡,这意味着您的分布的尾部比正态分布更短,即异常值更少,这可能是由于某些物理约束阻止了平均值的过度变化。

于 2011-02-01T13:11:24.453 回答
0

正态分布是一个密度函数。任何单个值的概率将为 0。这是因为您的总概率 (= 1) 分布在无限数量的值之间(它是一个连续函数)。

您在图中(正态分布)所拥有的是概率如何围绕值(x 轴)分布(y 轴)。所以你可以从图中得到的是 2 个点之间的间隔概率,从 -infinite 到任何点,或者从任何点到 +infinte。该概率是通过积分从点 1 到点 2 定义的(正态分布的)函数获得的。

但是你不必做这个积分,因为你有 z 表。z 表为您提供 x 介于 -infinite 和 x 之间的概率(应用将 x 与 z 相关联的方程)

我这里没有matlab,但我猜你提到的直线是累积分布函数,它告诉你x在[-infinite,x]之间的概率,并且由总和(或本例中的积分)确定从 -infinite 到 x 的值(或在 z 表中获得)

对不起,如果我的英语不好。我希望我有帮助。

于 2011-02-01T05:12:14.500 回答