给定来自某个来源的序列 pf 数字N
1 , N
2 , N
3...
,而不是 PRNG,而是说传感器或某种类型的记录数据,假设这样处理它是否安全
N
n
/ B = Q
nRem M
n
会导致序列Q
的熵比序列少M
吗?
注意:假设B
两者Q
和M
具有相同大小的范围。
这与观察到大多数现实世界的数据集,无论来源或来源,都具有对数分布有关;以 1 开头的数字比以 9 开头的数字更常见。但这对低阶部分几乎没有说明。
用一种有趣的方式来测试这个(并通过让他的计算机陷入困境来惹恼你的系统管理员)在 bash 中运行它:
ll -R 2>/dev/null | grep -v -e "^\./" | sed "s/[-rdwxlp]*\W*[0-9]*\W*[a-z]*\W*[a-z]*\W*\([0-9]\).*/\1/" | sort | uniq -c
并获取文件大小第一位的直方图。