24

我正在尝试使用 boost::normal_distribution 来生成均值为 0 和 sigma 1 的正态分布。

以下代码不起作用,因为某些值超过或超过 -1 和 1(不应该)。有人能指出我做错了什么吗?

#include <boost/random.hpp>
#include <boost/random/normal_distribution.hpp>

int main()
{
  boost::mt19937 rng; // I don't seed it on purpouse (it's not relevant)

  boost::normal_distribution<> nd(0.0, 1.0);

  boost::variate_generator<boost::mt19937&, 
                           boost::normal_distribution<> > var_nor(rng, nd);

  int i = 0; for (; i < 10; ++i)
  {
    double d = var_nor();
    std::cout << d << std::endl;
  }
}

我机器上的结果是:

0.213436
-0.49558
1.57538
-1.0592
1.83927
1.88577
0.604675
-0.365983
-0.578264
-0.634376

如您所见,所有值都不在 -1 和 1 之间。

谢谢大家!

编辑:当你有最后期限并避免在练习之前学习理论时,就会发生这种情况。

4

2 回答 2

29

以下代码不起作用,因为某些值超过或超过 -1 和 1(不应该)。有人能指出我做错了什么吗?

不,这是对正态分布的标准差(构造函数1中的第二个参数)的误解。

正态分布是熟悉的钟形曲线。该曲线有效地告诉您值的分布。接近钟形曲线峰值的值比远离的值(分布的尾部)更有可能。

标准偏差告诉您这些值的分布程度。数字越小,平均值附近的值越集中。数字越大,平均值附近的集中值越少。在下图中,您可以看到红色曲线的方差(方差是标准差的平方)为 0.2。将此与均值相同但方差为 1.0 的绿色曲线进行比较。您可以看到绿色曲线中的值相对于红色曲线更加分散。紫色曲线的方差为 5.0,值更加分散。

因此,这解释了为什么这些值不限于[-1, 1]. 然而,一个有趣的事实是 68% 的值总是在平均值的一个标准差范围内。因此,作为对自己的一项有趣的测试,编写一个程序,从均值为 0 方差为 1 的正态分布中提取大量值,并计算在均值的一个标准差内的数字。您应该得到一个接近 68% 的数字(更准确地说是 68.2689492137%)。

替代文字

1:来自boost文档

normal_distribution(RealType mean = 0, RealType sd = 1);

构造具有均值均值和标准差 sd 的正态分布。

于 2010-01-16T19:14:50.840 回答
8

你没有做错什么。对于正态分布,sigma 指定标准偏差,而不是范围。如果您生成足够多的样本,您将看到其中只有大约 68% 位于 [mean - sigma, mean + sigma] 范围内,大约 95% 在 2 sigma 内,超过 99% 在 3 sigma 内。

于 2010-01-16T18:57:12.440 回答