2

给定来自某个来源的序列 pf 数字N1 , N2 , N3...,而不是 PRNG,而是说传感器或某种类型的记录数据,假设这样处理它是否安全

Nn/ B = Qn Rem Mn

会导致序列Q的熵比序列少M吗?

注意:假设B两者QM具有相同大小的范围。


这与观察到大多数现实世界的数据集,无论来源或来源,都具有对数分布有关;以 1 开头的数字比以 9 开​​头的数字更常见。但这对低阶部分几乎没有说明。

用一种有趣的方式来测试这个(并通过让他的计算机陷入困境来惹恼你的系统管理员)在 bash 中运行它:

 ll -R 2>/dev/null | grep -v -e "^\./" | sed "s/[-rdwxlp]*\W*[0-9]*\W*[a-z]*\W*[a-z]*\W*\([0-9]\).*/\1/" | sort | uniq -c

并获取文件大小第一位的直方图。

4

1 回答 1

1

这取决于顺序。例如,取 [1 * 7 = 7, 3 * 7 = 21, 6 * 7 = 42 ... (2 * N - 1) * 7] 和 B = 7。Qn 将是 [1, 3, 6, ... 2 * N - 1] 并且 Mn 将始终为 0。通常,Q 的熵会更少,因为它就像移动一些位一样,但并不总是这样。

当然,这不适用于来自 (P)RNG 的数据,因为 Qn 的范围将与 Mn 的范围相同,并且对于两者来说,数字(几乎)是均匀分布的。

于 2009-05-31T22:07:08.520 回答