我已经阅读了香农的熵理论以及如何为二进制文件实现这样的算法(很容易)
但我无法弄清楚计算 .exe 或任何二进制文件的熵的目的是什么
我可以理解计算电信消息的熵(最坏的情况:每个符号都有相同的概率),但我无法理解二进制文件的目的。
有人可以解释一下吗?
我已经阅读了香农的熵理论以及如何为二进制文件实现这样的算法(很容易)
但我无法弄清楚计算 .exe 或任何二进制文件的熵的目的是什么
我可以理解计算电信消息的熵(最坏的情况:每个符号都有相同的概率),但我无法理解二进制文件的目的。
有人可以解释一下吗?
假设一些信息或动态系统或分布。熵是该信息/系统/分布中无序的度量。如果熵增长,无序也会增长。如果熵为 0,则表示没有无序,分布是恒定的。
我可以假设将所有这些应用于文件,如果其中的混乱是高文件,则更难压缩。并且具有低熵的文件(该文件中的大部分符号重合)压缩得更好。一般来说,我认为低熵的文件会更容易处理。
现在,大多数情况下,应用程序在二进制文件中计算熵,都与防病毒软件有关。防病毒软件使用熵来猜测文件是否被压缩/解包。通过了解熵级别,您也可以很好地了解二进制文件是否已加密。