我对熵公式的理解是它用于计算表示某些数据所需的最小位数。它通常在定义时措辞不同,但之前的理解是我直到现在所依赖的。
这是我的问题。假设我有一个 100 '1' 后跟 100 '0' = 200 位的序列。字母表是{0,1},熵的底是2。符号“0”的概率是0.5,“1”是0.5。所以熵是 1 或 1 位来表示 1 位。
但是,您可以使用类似 100 / 1 / 100 / 0 的方式对其进行游程长度编码,其中输出的位数后跟位。似乎我的表示小于数据。特别是如果您将 100 增加到更大的数字。
我目前正在使用:http ://en.wikipedia.org/wiki/Information_entropy作为参考。我哪里做错了?是分配给符号的概率吗?我不认为这是错的。还是我把压缩和熵之间的联系弄错了?还要别的吗?
谢谢。
编辑
我的后续回答是:您会将熵公式应用于消息的特定实例以尝试找出其信息内容吗?接受消息“aaab”并说熵是~0.811是否有效。如果是,那么 1...10....0 的熵是多少,其中 1 和 0 使用熵公式重复 n 次。答案是1?
是的,我了解您正在创建输入符号的随机变量,并根据您的消息猜测概率质量函数。我要确认的是熵公式没有考虑消息中符号的位置。