有什么办法可以找出 Python 用来为其随机数生成器播种的种子?
我知道我可以指定自己的种子,但我对 Python 管理它感到非常满意。但是,我确实想知道它使用了什么种子,所以如果我喜欢我在特定运行中获得的结果,我可以稍后重现该运行。如果我有使用的种子,那么我可以。
如果答案是我不能,那么自己生成种子的最佳方法是什么?我希望它们在每次运行时总是不同的——我只想知道使用了什么。
更新:是的,我的意思是 random.random()!错误... [标题更新]
无法从发生器中取出自动种子。我通常会生成这样的种子:
seed = random.randrange(sys.maxsize)
rng = random.Random(seed)
print("Seed was:", seed)
这种方式是基于时间的,因此每次运行脚本(手动)时都会有所不同,但如果您使用多个生成器,它们将不会具有相同的种子,因为它们几乎是同时创建的。
随机数生成器的状态并不总是简单的种子。例如,安全 PRNG 通常有一个熵缓冲区,它是一个更大的数据块。
但是,您可以保存和恢复随机数生成器的整个状态,以便稍后重现其结果:
import random
old_state = random.getstate()
print random.random()
random.setstate(old_state)
print random.random()
# You can also restore the state into your own instance of the PRNG, to avoid
# thread-safety issues from using the default, global instance.
prng = random.Random()
prng.setstate(old_state)
print prng.random()
当然,如果您想持久保存它的结果,getstate
可以腌制它。
您可以子类化 random.Random,以与 python 相同的方式(本例中为 v3.5)重写 seed() 方法,但在调用 super() 之前将种子值存储在变量中:
import random
class Random(random.Random):
def seed(self, a=None, version=2):
from os import urandom as _urandom
from hashlib import sha512 as _sha512
if a is None:
try:
# Seed with enough bytes to span the 19937 bit
# state space for the Mersenne Twister
a = int.from_bytes(_urandom(2500), 'big')
except NotImplementedError:
import time
a = int(time.time() * 256) # use fractional seconds
if version == 2:
if isinstance(a, (str, bytes, bytearray)):
if isinstance(a, str):
a = a.encode()
a += _sha512(a).digest()
a = int.from_bytes(a, 'big')
self._current_seed = a
super().seed(a)
def get_seed(self):
return self._current_seed
如果您对其进行测试,使用新种子生成的第一个随机值和使用相同种子(使用我们创建的 get_seed() 方法)生成的第二个值将相等:
>>> rnd1 = Random()
>>> seed = rnd1.get_seed()
>>> v1 = rnd1.randint(1, 0x260)
>>> rnd2 = Random(seed)
>>> v2 = rnd2.randint(1, 0x260)
>>> v1 == v2
True
如果您存储/复制巨大的种子值并尝试在另一个会话中使用它,生成的值将完全相同。
由于没有人提到通常您可以在任何编程语言中获得的最佳随机样本是通过操作系统生成的,因此我必须提供以下代码:
random_data = os.urandom(8)
seed = int.from_bytes(random_data, byteorder="big")
这是加密安全的。
资料来源:https ://www.quora.com/What-is-the-best-way-to-generate-random-seeds-in-python
值 8 它似乎产生与我相同的位数sys.maxsize
。
>>> int.from_bytes(os.urandom(8), byteorder="big")
17520563261454622261
>>> sys.maxsize
9223372036854775807
>>>
如果您使用“设置”种子random.seed(None)
,随机发生器将作为系统时间的函数自动播种。但是,正如您所观察到的,您无法访问此值。当我想随机化但仍然知道种子时我会做什么:
tim = datetime.datetime.now()
randseed = tim.hour*10000+tim.minute*100+tim.second
random.seed(randseed)
注意:我更喜欢使用time.time()
@Abdallah 提出的这种方法的原因是,这样 randseed 是人类可读的并且可以立即理解,这通常有很大的好处。还可以根据需要添加日期组件甚至微分段。
我想做同样的事情,但我无法得到种子。所以,我想既然种子是从时间产生的。我使用系统时间创建了我的种子并将其用作种子,所以现在我知道使用了哪个种子。
SEED = int(time.time())
random.seed(SEED)
种子是随机包中的一个内部变量,用于创建下一个随机数。当请求新号码时,种子也会更新。
如果您想确保每次都具有相同的随机数,或者使 i 可配置,我会简单地使用 0 作为种子。
CorelDraw 曾经有一个随机模式生成器,它是用种子初始化的。不同种子的模式差异很大,因此种子是模式的重要配置信息。它应该是您运行的配置选项的一部分。
编辑:正如 ehemient 所指出的,随机数生成器的内部状态可能比种子更复杂,具体取决于其实现。