4

我将如何使用 NodeJS 将下面的字符串从 baseE91 解码为可读文本?

8D7Hh-9D*.n-!DZrG-#DE-$DD-%DC-sl-tl-BEp2m-CE^Ul-DE}CH-EEE-FED-GEC-<l-=l-hE(.K-iEvqS-jEB-kEB-lEB-mEB-Rm-Sm-%E!{Q-&EDgN-(EG:K-)EE-*EE-+EB-xm-ym-GF{}U-HF()Q-IFt%D-JFE-KFB-LFD-[m-]m-mF;JG-nF7]Q-oF2-pFB-qFC-rFB-Wn-Xn-+FD-,FE-.FB- FE-:FD-;FC-2n-3n-

* 编辑 *

使用 baseE91 表,我设法将上面的字符串转换为十六进制字符串

十六进制字符串

5668557210457684246110336890114713568693668683768671151081161086669112501096769948510868691567726969697069687169676010861108104694046751056911811383106696610769661086966109696682109810937693312381386968103784069715875416969426969436966120109121109717012312585727040418173701637687470697570667670689110993109109705974711107055938111170501127066113706711470668711088104370684470694670664770695870685970675011051110

然后我把它喂进缓冲区

var buf = new Buffer(hex, 'hex');
console.log(buf.toString('utf8'));

这给了我:

VhUr►Ev?$a►3h?◄G‼V??f??v?q§►?▬►?f?↕P►?v?Hhi↕Vw&???♠??▬?va►?♦i@Fu►V?↑◄81♠if►v?if►??h!    ?►??1#?8ih►7?♠?§?T▬??&??6?a ►?!►?↨☺#↕XW'♦♦↑↨7☺▬7htpiupfvph?►?1 ►?♣?G◄►p    U??◄↨♣☺↕pf◄7♠q¶pf??►CphDpiFpfGpiXphYpgP◄♣◄►

我怎样才能把它变成我可以使用的东西?我怀疑它是一个 JSON 对象......

4

4 回答 4

4

你有两个非常独立的问题,在这个讨论中被混为一谈。

如何使用 Javascript/NodeJS/CommnJS 解码 baseE91?

这就是你的问题一目了然,你已经得到 了各种不同的 回应。答案似乎是:没有现成的解决方案,但是 basE91 足够小且足够简单,您应该能够将其移植到 JS 中而不会遇到太多麻烦。

您的第二个不太明确的问题似乎是:

如何对《创世纪之王》的游戏服务器通信协议进行逆向工程?

您提到您的“basE91 LE”字符串来自一个 MMO 游戏服务器,而这个论坛发布的有关 Ultima 之王的帖子几乎是“basE91 little endian”的唯一其他热门。 (而且看起来你几天前在那里发布过。) 正如多方指出的那样,你发布的数据不是普通的 basE91 BaseE91 使用了一组明确定义的字符,' ' 和 ' '(空格)不在其中,但都出现在您的数据中。您在评论中提到您认为 ' ' 被用作分隔符,如果预先提供更多类似的信息,回答第二个问题会更容易。--

关于这个问题的一些注释:

  • BaseE91 使用标准编码表。如果您正在制作一款在线游戏,并且想稍微混淆一下您的流量,那么使用不同的或打乱的桌子将是微不足道的。这将解释出现在您的数据中的不合法的 baseE91 字符。另外,来自那个论坛的这篇文章看起来就是这样:一个不同的解码/编码表。您是否尝试过使用该表手动解码部分数据并查看它是否有意义?

  • 您请求转换为“可读文本”,但 baseE91 用于传输二进制数据,因此不清楚为什么将其用于纯文本。即使假设它正在编码文本,也有各种常见的方法来编码纯文本,而解码的数据似乎没有这样做。更有可能的是,数据是实际的二进制数据,并且在非常真实的意义上,baseE91文本表示。如果没有有关您期望的输出的更多信息,就很难知道您希望它如何翻译成文本。这是 1 像素透明 gif 的 baseE91 编码:

    JaQGWo*HBtAARDBtB"B"B"S|QtAAAA$M)Bc4v(#AsAAABtAACABtlBLHBtd
    

    可以将其转换为可读文本吗?你提到你认为它是 JSON,你能给我们一些关于你为什么这么认为的提示吗?(同样,为什么要使用二进制编码器来处理纯文本?)

  • 从同一个论坛帖子中工作,听起来您正在使用一系列 5 位坐标,所以也许这些数字就是您正在寻找的?然而,还有更多的难题,因为这些 baseE91 组编码不同的大小数字。机智(难以理解的文字警告墙):

    echo '8D7Hh-9D*.n-!DZrG-#DE-$DD-%DC-sl-tl-BEp2m-CE^Ul-DE}CH-EEE-FED-GEC-<l-=l-hE(.K-iEvqS-jEB-kEB-lEB-mEB-Rm-Sm-%E!{Q-&EDgN-(EG:K-)EE-*EE-+EB-xm-ym-GF{}U-HF()Q-IFt%D-JFE-KFB-LFD-[m-]m-mF;JG-nF7]Q-oF2-pFB-qFC-rFB-Wn-Xn-+FD-,FE-.FB- FE-:FD-;FC-2n-3n-' \
    | while IFS='' read -d - a; do echo -n "'$a' => "; echo -n "$a" \
    | ./base91 -d | hexdump | head -1 | cut -d ' ' -f 2-; done
    # head and cut are easier that understanding hexdump's formatting system
    '8D7Hh' => 4d 01 57 84                                    
    '9D*.n' => 4e a1 3b 9f                                    
    '!DZrG' => 4f 41 ec 19                                    
    '#DE' => 50 81                                          
    '$DD' => 51 61                                          
    '%DC' => 52 41                                          
    'sl' => 53                                             
    'tl' => 54                                             
    'BEp2m' => 6d 61 6b 9a                                    
    'CE^Ul' => 6e e1 ed 94                                    
    'DE}CH' => 6f c1 21 1c                                    
    'EEE' => 70 81                                          
    'FED' => 71 61                                          
    'GEC' => 72 41                                          
    '<l' => 73                                             
    '=l' => 74                                             
    'hE(.K' => 8d 61 3b 2b                                    
    'iEvqS' => 8e a1 e3 49                                    
    'jEB' => 8f 21                                          
    'kEB' => 90 21                                          
    'lEB' => 91 21                                          
    'mEB' => 92 21                                          
    'Rm' => 93                                             
    'Sm' => 94                                             
    '%E!{Q' => ad 01 da 43                                    
    '&EDgN' => ae 61 6c 35                                    
    '(EG:K' => af 81 4a 2b                                    
    ')EE' => b0 81                                          
    '*EE' => b1 81                                          
    '+EB' => b2 21                                          
    'xm' => b3                                             
    'ym' => b4                                             
    'GF{}U' => cd c1 f3 53                                    
    'HF()Q' => ce e1 0d 43                                    
    'IFt%D' => cf 01 e9 0e                                    
    'JFE' => d0 81                                          
    'KFB' => d1 21                                          
    'LFD' => d2 61                                          
    '[m' => d3                                             
    ']m' => d4                                             
    'mF;JG' => ed c1 6f 18                                    
    'nF7]Q' => ee 21 ac 43                                    
    'oF2' => ef c1                                          
    'pFB' => f0 21                                          
    'qFC' => f1 41                                          
    'rFB' => f2 21                                          
    'Wn' => f3                                             
    'Xn' => f4                                             
    '+FD' => 0d 62                                          
    ',FE' => 0e 82                                          
    '.FB' => 0f 22                                          
    ' FE' => 71                                             
    ':FD' => 11 62                                          
    ';FC' => 12 42                                          
    '2n' => 13                                             
    '3n' => 14           
    

    那里肯定有一个模式,如果你眯着眼睛看的话,甚至看起来像小端。但它们对我来说没有任何意义,它们在你看来是明智的吗?

于 2012-07-14T05:23:50.923 回答
2

github 上有相当紧凑的编码器/解码器 Java 实现basE91。我认为这应该很容易翻译成 JS。

直接链接到源文件

于 2012-07-09T21:34:49.453 回答
0

简短的回答是在 node.js 中没有简单/快速的方法来做到这一点(显然目前也没有模块。)

添加到@bryanmac 的评论中,使用 base91 作为起点(主要源文件只有 160 行,包括版权!),您可以将数据存储在 node.js 缓冲区中,一旦从 base91 转换为字节,使用内置 node.js 方法来转换为字符串。

于 2012-07-09T21:23:22.527 回答
-1

对于“如何使用 Javascript/NodeJS/CommnJS 解码 baseE91?”

我将原来的 baseE91迁移到 JavaScript 中,目前String支持. 你可以试试: Equim-chan/base91BufferStream

首先我们需要一个表:

const table = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789!#$%&()*+,./:;<=>?@[]^_`{|}~"';

的核心部分encode

// `raw` is the input, asserted as `Buffer`
const len = raw.length;
let ret = '';
let n = 0;
let b = 0;

for (let i = 0; i < len; i++) {
  b |= raw[i] << n;
  n += 8;

  if (n > 13) {
    let v = b & 8191;
    if (v > 88) {
      b >>= 13;
      n -= 13;
    } else {
      v = b & 16383;
      b >>= 14;
      n -= 14;
    }
    ret += table[v % 91] + table[v / 91 | 0];
  }
}

if (n) {
  ret += table[b % 91];
  if (n > 7 || b > 90) ret += table[b / 91 | 0];
}

return ret;  // basE91 encoded string

的核心部分decode

// `raw` is the input, asserted as `String`
const len = raw.length;
const ret = [];
let b = 0;
let n = 0;
let v = -1;

for (let i = 0; i < len; i++) {
  const p = table.indexOf(raw[i]);
  if (p === -1) continue;
  if (v < 0) {
    v = p;
  } else {
    v += p * 91;
    b |= v << n;
    n += (v & 8191) > 88 ? 13 : 14;
    do {
      ret.push(b & 0xff);
      b >>= 8;
      n -= 8;
    } while (n > 7);
    v = -1;
  }
}

if (v > -1) {
  ret.push((b | v << n) & 0xff);
}

return Buffer.from(ret);  // basE91 decoded Buffer

以上是标准的 basE91 编码/解码,但正如@blahdiblah 所提到的,显然您从服务器收到了一个非标准的 basE91 编码字符串(标准表中没有*也没有)。

于 2017-05-28T07:41:59.200 回答