0

这是对此的后续问题:Google Analytics Character encoding of __utm cookies

我将以下字符串存储在数据存储区中db.TextProperty- Test%D0%AFTest。这是从 utf-8 编码的 cookie 值中读取的。

我试图简单地将这个字符串打印到浏览器中TestЯTest(注意向后的 R),但我能显示的只是:TestЯTest

我尝试了各种 unicode、encode('utf-8') decode('utf-8') 解决方案,但似乎没有任何效果。我得到一个UnicodeDecode Error或上面的文本。

我的 HTTP 标头包含以下行:Content-Type: text/html; charset=utf-8 and the HTML itself contains the meta tag: http-equiv="Content-Type" content="text/html; charset=utf-8"

似乎没有任何效果。

4

1 回答 1

0

由于它是作为 URL 的一部分存储的,因此您必须使用urllib.unparse. 您对编码有正确的想法,您只需要执行“解解析” URL 的额外步骤。

>>> import urlparse
>>> s = 'Test%D0%AFTest'
>>> print urlparse.unquote(s).decode('utf8')
TestЯTest
于 2012-10-15T04:57:38.163 回答