16

我的工作项目是使用Jackson JSON序列化程序将一堆 Java 对象转换为字符串,以便将它们发送到 REST 服务。

其中一些对象包含敏感数据,因此我编写了自定义序列化程序来将这些对象序列化为 JSON 字符串,然后 gzip 压缩它们,然后使用AES;加密它们。

这会将字符串转换为字节数组,因此我在编解码器中使用Base64编码Apache commons器将字节数组转换为字符串。REST 接口后面的自定义反序列化器反转了这个过程:

base64 decode -> decrypt -> decompress -> deserialize using default Jackson deserializer.

Base64编码会增加输出的大小(序列化中的 gzip 步骤旨在帮助改善这种增加),所以我检查了谷歌,看看是否有更有效的替代方案,这导致我找到了之前的 stackoverflow 线程,该线程将Ascii85编码为更有效的替代方案 -

Base64输出大小增加 33%,输出大小Ascii85增加 25%。

我发现了一些 Java Ascii85 实现,例如 Apache pdfbox,但我对使用编码有点谨慎 - 似乎几乎没有人在使用或实现它,这可能只是意味着 Base64 有更多的惯性,或者这可能意味着Ascii85 有一些奇怪的问题。

有人对这个主题了解更多吗?Ascii85 是否有任何问题意味着我应该改用 Base64?

4

3 回答 3

17

Base64更常见。在大多数情况下,大小的差异实际上并不那么显着,如果您在 HTTP 级别(将压缩 base64)而不是您的有效负载中添加,您很可能会发现差异完全消失了。

Ascii85 是否有任何问题意味着我应该改用 Base64?

我强烈建议使用 base64,因为它广泛。这几乎是将二进制数据表示为文本的规范方式(当然,除非您想使用十六进制)。

于 2012-11-15T21:35:46.010 回答
8

ASCII85 是一种很好的编码,可以用来节省额外的空间。但它会输出许多字符,如果通过 HTTP 天真地发送这些字符就需要转义。Base64 编码有一个变体,可以通过 HTTP 发送而无需任何转义。

这是一个 javascript ASCII85 编码器,以防有人需要尝试:

// By Steve Hanov. Released to the public domain.
function encodeAscii85(input) {
  var output = "<~";
  var chr1, chr2, chr3, chr4, chr, enc1, enc2, enc3, enc4, enc5;
  var i = 0;

  while (i < input.length) {
    // Access past the end of the string is intentional.
    chr1 = input.charCodeAt(i++);
    chr2 = input.charCodeAt(i++);
    chr3 = input.charCodeAt(i++);
    chr4 = input.charCodeAt(i++);

    chr = ((chr1 << 24) | (chr2 << 16) | (chr3 << 8) | chr4) >>> 0;

    enc1 = (chr / (85 * 85 * 85 * 85) | 0) % 85 + 33;
    enc2 = (chr / (85 * 85 * 85) | 0) % 85 + 33;
    enc3 = (chr / (85 * 85) | 0 ) % 85 + 33;
    enc4 = (chr / 85 | 0) % 85 + 33;
    enc5 = chr % 85 + 33;

    output += String.fromCharCode(enc1) +
      String.fromCharCode(enc2);
    if (!isNaN(chr2)) {
      output += String.fromCharCode(enc3);
      if (!isNaN(chr3)) {
        output += String.fromCharCode(enc4);
        if (!isNaN(chr4)) {
          output += String.fromCharCode(enc5);
        }
      }
    }
  }

  output += "~>";

  return output;
}
<input onKeyUp="result.innerHTML = encodeAscii85(this.value)" placeholder="write text here" type="text">
<p id="result"></p>

于 2015-04-02T14:45:42.557 回答
3

这是 JavaScript 中匹配的 ASCII85 AKA Base85 解码器(用于用户Qwerty):

function decode_ascii85(a) {
  var c, d, e, f, g, h = String, l = "length", w = 255, x = "charCodeAt", y = "slice", z = "replace";
  for ("<~" === a[y](0, 2) && "~>" === a[y](-2), a = a[y](2, -2)[z](/\s/g, "")[z]("z", "!!!!!"), 
  c = "uuuuu"[y](a[l] % 5 || 5), a += c, e = [], f = 0, g = a[l]; g > f; f += 5) d = 52200625 * (a[x](f) - 33) + 614125 * (a[x](f + 1) - 33) + 7225 * (a[x](f + 2) - 33) + 85 * (a[x](f + 3) - 33) + (a[x](f + 4) - 33), 
  e.push(w & d >> 24, w & d >> 16, w & d >> 8, w & d);
  return function(a, b) {
    for (var c = b; c > 0; c--) a.pop();
  }(e, c[l]), h.fromCharCode.apply(h, e);
}
<input onKeyUp="result.innerHTML = decode_ascii85(this.value)" placeholder="insert encoded string here" type="text">
<p id="result"></p>
example: <xmp><~<+oue+DGm>@3BW*D/a<&+EV19F<L~></xmp>

于 2015-07-31T08:11:38.813 回答