11

我有一个应该是 UCS-2 编码的 xml 文档,经过一些调整后,我设法构建了一个基于 minidom 的 DOM。

问题是我应该有一些在base64上编码的数据。我知道一个事实:

AME= (or \x00A\x00M\x00E\x00=) is base64 code for Á

我将如何解码?

http://www.fileformat.info/info/unicode/char/00c1/index.htm显示 Á 的 unicode 表示为:u"\u00C1" 和 UTF-16:0x00C1

base64.b64decode('AME=').decode('UTF-16')

节目

u'\uc100'

作为字符的 unicode 表示,但它看起来是字节交换的。

关于如何解码的任何想法?

4

1 回答 1

16

看一下这个

>>> import base64
>>> base64.b64decode('AME=').decode('UTF-16')
u'\uc100'
>>> base64.b64decode('AME=').decode('UTF-16LE')  
u'\uc100'
>>> base64.b64decode('AME=').decode('UTF-16BE')
u'\xc1'

也许您正在寻找大端解码?

于 2011-08-03T07:45:56.633 回答