0

在我的应用程序中 - 按照 Ned Batchelder 制作unicode 三明治的建议- 我首先尝试从 Windows-1252 解码为 UTF-8:

row[field] =row[field].decode('cp1252').encode('utf-8')

稍后,当我想将数据发送到端点时,我解码 UTF-8:

row[field] = fld.decode('utf-8')

当我只打印包含有问题的 Windows-1252 字符的字段时,它会将它们解释为:

print row['dash']
# as well — ... “the intent was"

但是当我尝试打印整个字典时,我得到了 unicode 值:

print row
# as well \xe2\x80\x93 ... \xe2\x80\x9cthe intent was\xe2\x80\x9d

我想要 wp-1252 字符本身或等价物,例如直引号而不是左引号或右引号。

4

0 回答 0