我想压缩很多小字符串(大约 75-100 长度的 c# 字符串)。在创建字典时,我已经知道所有短字符串(近一万亿)。将来不会有额外的短字符串。我需要额外的一个字符串而不解压缩其他字符串。
现在我正在寻找一个库或执行以下操作的最佳方法:
- 使用我拥有的所有字符串创建字典
- 使用此字典压缩每个字符串
- 一种使用 1 中的字典压缩一个字符串的方法。
我找到了一个很好的相关问题,但这不是 c# 特定的。也许有一些我不知道的 c# 的东西,或者一个花哨的库或者有人已经这样做了。这就是我问这个问题的原因。
编辑:
用字典我说的是这样的事情:http ://en.wikipedia.org/wiki/Dictionary_coder 但一切都有助于缩短字符串。这些字符串是各种语言和 URL (30%/70%) 的短文本消息。压缩字符串不需要是人类可读的。它将存储在二进制文件中。