17

这个问题是基于那个的副作用。

我的.py文件在第一行都有# -*- coding: utf-8 -*-编码定义器,比如我的api.py

正如我在相关问题中提到的,我HttpResponse用来返回 api 文档。由于我通过以下方式定义编码:

HttpResponse(cy_content, content_type='text/plain; charset=utf-8')

一切正常,当我调用我的 API 服务时,除了pprint 从字典中形成的字符串之外,没有任何编码问题

由于我在我的 dict 中的某些值中使用土耳其语字符,因此 pprint 将它们转换为unichr等价物,例如:

API_STATUS = {
    1: 'müşteri',
    2: 'some other status message'
}

my_str = 'Here is the documentation part that contains Turkish chars like işüğçö'
my_str += pprint.pformat(API_STATUS, indent=4, width=1)
return HttpRespopnse(my_str, content_type='text/plain; charset=utf-8')

我的纯文本输出如下:

Here is the documentation part that contains Turkish chars like işüğçö

{
    1: 'm\xc3\xbc\xc5\x9fteri',
    2: 'some other status message'
}

我尝试将 pprint 输出解码或编码为不同的编码,但没有成功......克服这个问题的最佳实践是什么

4

2 回答 2

39

pprint默认情况下似乎使用repr,您可以通过覆盖来解决此问题PrettyPrinter.format

# coding=utf8

import pprint

class MyPrettyPrinter(pprint.PrettyPrinter):
    def format(self, object, context, maxlevels, level):
        if isinstance(object, unicode):
            return (object.encode('utf8'), True, False)
        return pprint.PrettyPrinter.format(self, object, context, maxlevels, level)


d = {'foo': u'işüğçö'}

pprint.pprint(d)              # {'foo': u'i\u015f\xfc\u011f\xe7\xf6'}
MyPrettyPrinter().pprint(d)   # {'foo': işüğçö}
于 2012-06-04T15:28:41.173 回答
1

您应该使用 unicode 字符串而不是 8 位字符串:

API_STATUS = {
    1: u'müşteri',
    2: u'some other status message'
}

my_str = u'Here is the documentation part that contains Turkish chars like işüğçö'
my_str += pprint.pformat(API_STATUS, indent=4, width=1)

pprint模块旨在以可读的方式打印出所有可能的嵌套结构。为此,它将打印对象表示,而不是将其转换为字符串,因此无论您是否使用 unicode 字符串,您都会得到转义语法。但是,如果您在文档中使用 unicode,那么您真的应该使用 unicode 文字!

无论如何,thg435 已经为您提供了如何更改 pformat 的这种行为的解决方案。

于 2012-06-04T15:17:58.660 回答