1

我在所有 32 位整数的空间中都有一个连续的整数流,并且在每次更新时,我都想知道我遇到的整数分布的确切或近似熵。它可以是整个生命周期的全局熵,也可以是随着时间的推移衰减旧信息的窗口近似值。

有谁知道已经这样做的库或具有此属性的算法?

显然,这是一种流式算法,因为每次迭代范围并计算每次更新的熵太昂贵了。有谁知道这样的算法或草图数据结构可以做到这一点?

动机和用例是我想检测整数流中的偏斜。它应该在整数范围内是均匀的,但在某些时候,由于其他条件,均匀性可能会受到干扰,我认为熵是检测这种情况的最佳方法。理想情况下,我会对计算组件的低熵发出警报。

谢谢你的帮助!

编辑:我实际上找到了一篇完全做到这一点的论文,但我知道没有现有的实现。重用经过测试、验证的代码比自己实现要好得多。:)

4

0 回答 0