8

围绕mt19937的使用似乎有一些神话,特别是一旦播种生成器产生的“一些”比特数应该被忽略,以便尽可能接近伪随机性。

我见过的代码示例如下:

boost::mt19937::result_type seed = 1234567; //taken from some entropy pool etc
boost::mt19937 prng(seed);
boost::uniform_int<unsigned int> dist(0,1000);
boost::variate_generator<boost::mt19937&,boost::uniform_int<unsigned int> > generator(prng,dist);

unsigned int skip = 10000;
while (skip--)
{
   generator();
}

//now begin using for real.
....

我的问题是:

  1. 这是神话还是这一切都有真相?

  2. 如果它是可行的,应该忽略多少位?因为我看到的数字
    似乎是任意的

4

1 回答 1

4

第一条评论中引用的论文Mersenne Twister 具有改进的初始化,不仅仅是某个人,他是 Boost 实现所基于的论文的两位合著者之一。

根据Boost 文档,使用单个 32 位整数(4 字节)作为此生成器的种子的问题在于,生成器的内部状态为 2496 字节。这么小的种子需要一段时间才能传播到生成器的其余内部状态,这并不奇怪,特别是因为 Twister 并不意味着加密安全。

为了解决您对需要运行生成器一段时间才能开始的担忧,您需要备用(和显式)构造函数。

template<typename SeedSeq> explicit mersenne_twister_engine(SeedSeq &);

这是第三条评论的精神,在这里您使用比单个整数更长的东西进行初始化。序列提供来自某个生成器。要使用熵池,请将生成器编写为熵池中的适配器,并根据需要从池中返回值。

于 2012-11-08T14:48:03.340 回答