我已经对整数的数据序列进行了排序。2 个数字之间的最大差值为 3。因此数据看起来像这样:
Data: 1 2 3 5 7 8 9 10 13 14
Differences: (start 1) 1 1 2 2 1 1 1 3 1
有没有比保存差值更好的方法来存储(压缩)这种类型的序列?因为如果我使用基于字典的方法,由于数字 1,2 和 3 的随机性,它无法压缩。如果我使用“PAQ”样式压缩,结果会更好,但仍然不太令人满意。霍夫曼和算术编码器比基于字典的方法差。
有什么方法可以预测吗?
例如,对原始数据使用回归而不是存储差异(可能更小或更一致)
或者使用某种基于差异直方图的预测?
或者完全不同的东西......或者根本不可能(在我看来,这是真正的答案:))