0

我正在编写一个需要处理德语字母的简单模块,例如 ASCII 132。我已经阅读了这个站点上给出的大部分建议,以及其他关于如何在 Python2.x 中处理 unicode 和编码的建议。但是,事情对我来说并不奏效。例子

    >>> import sys,unicodedata
    >>> x='a'
    >>> u=unicode(x,'utf-8')
    >>> unicodedata.category(u)
    'Ll'
    >>> y=u.encode('latin-1') #to turn string into bytes
    >>> y=y.decode('utf-8') # to turn bytes back to strin but encoded utf-8
    >>> unicodedata.category(y)
    'Ll'

我究竟做错了什么?为什么我不能将编码更改为 utf8?

顺便说一句,我复制了一个名为 sitecustomize.py 的文件,该文件应该将默认编码设置为 utf-8。Sys.getdefaultcode() 实际上将 utf-8 显示为默认编码,信不信由你。

4

1 回答 1

2
于 2013-08-15T18:06:13.303 回答