0

我想压缩.txt包含yyyy-mm-dd hh:mm:ss格式日期和有时倾向于在不同行中重复的英文单词的文件。
我阅读了一些关于压缩算法的文章,发现在我的情况下,基于字典的编码比基于熵的编码更好。因为我想自己实现算法,所以我需要一些不是很复杂的东西。所以我关注了LZW和LZ77,但无法在它们之间进行选择,因为我发现的文章的结论是矛盾的。根据一些文章,LZW 具有更好的压缩比,而根据其他人的说法,领导者是 LZ77。所以问题是在我的情况下哪一个最有可能会更好?是否有更易于实现的算法对我的目的有益?

4

1 回答 1

2

LZW 已过时。现代,甚至是相当古老的 LZ77 压缩机的性能都优于 LZW。

无论如何,您是唯一可以回答您的问题的人,因为只有您拥有要压缩的数据的示例。只需对您的数据尝试各种压缩方法(zstd、xz、lz4 等),看看哪种压缩比和速度组合可以满足您的需求。

于 2019-02-11T06:07:50.490 回答