4

我在 Unix shell 中试验 $RANDOM 变量并注意到一些奇怪的东西。我运行了以下命令,它在循环中读取 $RANDOM 100k 次,然后将输出通过管道传输到“uniq”以查找重复项。

$ for i in {1..100000}; do echo $RANDOM; done | uniq -d

我将上面的命令运行了 7 次,同样的两个数字(4455 和 4117)全部重复了 7 次。下面的屏幕截图显示了命令行输出。

kali@kali:~% for i in {1..100000}; do echo $RANDOM; done | uniq -d
4455
4117
kali@kali:~% for i in {1..100000}; do echo $RANDOM; done | uniq -d
4455
4117
kali@kali:~% for i in {1..100000}; do echo $RANDOM; done | uniq -d
4455
4117
kali@kali:~% for i in {1..100000}; do echo $RANDOM; done | uniq -d
4455
4117
kali@kali:~% for i in {1..100000}; do echo $RANDOM; done | uniq -d
4455
4117
kali@kali:~% for i in {1..100000}; do echo $RANDOM; done | uniq -d
4455
4117
kali@kali:~% for i in {1..100000}; do echo $RANDOM; done | uniq -d
4455
4117

见:https ://i.stack.imgur.com/5bpEe.png

我还打开了另一个终端窗口并重复了该过程。在第二个航站楼,数字不同,但以类似的方式重复。这让我想知道 $RANDOM 变量的熵是什么时候产生的,以及它是如何播种的。

我的猜测是,每当调用它时都会重新播种bash,但我想知道是否有人知道为什么当我在单个终端窗口中重复命令时重复相同的值。

4

2 回答 2

5

这是由于子shell 中 RANDOM 的 zsh 错误/“行为”。此错误不会出现在 bash 中。

echo $RANDOM # changes at every run  
echo `echo $RANDOM` # always return the same value until you call the first line

因为 RANDOM 是通过其最后一个值播种的,但在子 shell 中,获得的值不会在主 shell 中更新。

man zshparam

RANDOM <S>
A  pseudo-random  integer  from 0 to 32767, newly generated each
time this parameter is referenced.  The random number  generator
can be seeded by assigning a numeric value to RANDOM.

The   values   of   RANDOM   form   an  intentionally-repeatable
pseudo-random sequence; subshells  that  reference  RANDOM  will
result  in  identical  pseudo-random  values unless the value of
RANDOM is referenced or seeded in the parent  shell  in  between
subshell invocations.

甚至更疯狂,因为调用uniq创建了一个子shell

for i in {1..10}; do echo $RANDOM; done # changes at every run 
for i in {1..10}; do echo $RANDOM; done | uniq # always the same 10 numbers

来源:Debian 错误报告 828180

于 2020-08-24T10:39:18.413 回答
4

随机数生成器并不完美。Lehmer 随机数生成器用于带有“标准”常量的bash 源代码:

x(n+1) = 16807 * x(n) mod (2**31 - 1)

此外,bash仅将输出限制为 15 位

#  define BASH_RAND_MAX 32767
...
return ((unsigned int)(rseed & BASH_RAND_MAX));

有了种子,你的外壳就被播种了,这些数字恰好在 10000 个随机数的连续输出中一个接一个地出现44554117那里真的没有什么令人惊讶的。您可以计算种子以获得两个连续的数字,知道:

# We know that lower 15 bits of previous number are equal to 4455
x(n) mod 32768 = 4455
# We know that lower 15 bits of previous number are equal to 4455
x(n+1) mod 32768 = 4455
# We know the relation between next and previous number
x(n+1) = 16807 * x(n) mod (2**31 - 1)
# You could find x(n)

为什么重复相同的 $RANDOM 数字?

因为在 bash 源中使用的伪随机生成器方法与您的 shell 中的当前种子恰好重复相同的数字。

于 2020-08-23T09:08:49.220 回答