0

我想知道以下哪种场景将无损算法应用于具有重复数据的二进制数据的最高比率。

我是否正确假设压缩比取决于模式?

  1. 尺寸
  2. 多次重复

例如二进制数据:

10 10 10 10 10 10 10 10 图案 (10) 尺寸 2,图案 (10) 重复 8

1001 1001 1001 1001图案(1001)尺寸4,图案(1001)重复4

0000000 11111111 图案(0)尺寸1,图案(0)重复8;图案(1)尺寸1,图案(1)重复8;或 0000000 11111111 模式 (0000000) 大小 8,模式 (0000000) 重复 8;图案 (11111111) 尺寸 8,图案 (11111111) 重复 1;

以上哪个实现了最高和最低的压缩比?

提前致谢。

4

1 回答 1

2

这些都是在野外不太可能看到的序列。这个问题的重点是什么?

普通的压缩器是面向字节的。因此,任何导致相同字节重复的模式都将提供最高的压缩率。例如,放气限制中的 1032:1。短模式的其他简单重复将获得非常高的压缩比。例如,对于两个或三个重复字节的模式,再次使用 1032:1 进行放气。

在这些荒谬的极端情况下,压缩限制是压缩格式的函数,而不是数据的函数。

于 2012-10-09T01:41:16.700 回答