1

我在比较从 PostgreSQL 数据库获得的 UTF-8 字符串时遇到问题:

>>> db_conn = psycopg2.connect("dbname='foo' user='foo' host='localhost' password='xxx'")
>>> db_cursor = db_conn.cursor()
>>> sql_com = ("""SELECT my_text FROM table WHERE id = 1""")
>>> db_cursor.execute(sql_com)
>>> sql_result = db_cursor.fetchone()
>>> db_conn.commit()
>>> db_conn.close()
>>> a = sql_result[0]
>>> a
u'M\xfcnchen'
>>> type(a)
<type 'unicode'>
>>> print a
München
>>> b = u'München'
>>> type(b)
<type 'unicode'>
>>> print b
München
>>> a == b
False

我真的很困惑为什么会这样,我可以有人告诉我应该如何将一个字符串与数据库中的元音变音符号与另一个字符串进行比较,所以比较是真的吗?我的数据库是 UTF8:

postgres@localhost:$ psql -l
        List of databases
   Name    |  Owner   | Encoding 
-----------+----------+----------
 foo       | foo      | UTF8
4

2 回答 2

3

这显然是控制台语言环境的问题。

u"München"u'M\xfcnchen'Unicode 和'M\xc3\xbcnchen'UTF-8。München如果采用 ISO8859-1 或 CP1252,后者就是你的。

Psycopg2 似乎为您提供了正确的 Unicode 值,因为它应该。

于 2011-01-19T18:31:36.010 回答
1

如果你输入

b = 'München'

你从 type(b) 得到什么?

也许您不需要将字符串逐字转换为 unicode 文本,因为 Python 会自动注意到这一点。

编辑:我从我的 python CLI 得到这个:

>>> b = u'München'
>>> b
u'M\xfcnchen'
>>> print b
München

当您使用不同的编码时,您的打印结果

于 2011-01-19T17:47:03.227 回答