假设源字母表是a,b,c,以a为终止符号,则单位区间对应地划分为[0,P(a),P(a)+P(b),1]。
由一串以 a(终止符号)结尾的 b 和 c 组成的字符串对编码有效。中间有 a 的字符串被认为对编码无效。
因此很容易构造编码位于区间 [P(a), 1) 中的字符串。但是算术编码是否为任何字符串分配了区间 [0, P(a)) 中的编码?空字符串是否有资格被编码为位于 [0, P(a)) 中的位串?因为空字符串可以被认为是字符串“a”或只是终止符号。
由于将空间用于编码空字符串似乎毫无意义,为什么不将单位间隔的第一个除法设为 [0, (P(b)-P(a))/(1-P(a)), 1] 对应映射 [P(a), P(a)+P(b), 1] 以填充单位区间。然后后续的细化划分将照常使用 [0, P(a), P(a)+P(b), 1]。