我想压缩.txt
包含yyyy-mm-dd hh:mm:ss
格式日期和有时倾向于在不同行中重复的英文单词的文件。
我阅读了一些关于压缩算法的文章,发现在我的情况下,基于字典的编码比基于熵的编码更好。因为我想自己实现算法,所以我需要一些不是很复杂的东西。所以我关注了LZW和LZ77,但无法在它们之间进行选择,因为我发现的文章的结论是矛盾的。根据一些文章,LZW 具有更好的压缩比,而根据其他人的说法,领导者是 LZ77。所以问题是在我的情况下哪一个最有可能会更好?是否有更易于实现的算法对我的目的有益?
问问题
1743 次