4

我正在使用 pyodbc 连接 sqlserver,下面是我的连接字符串..一切正常,但结果以 unicode 字符串返回..我在连接字符串中有 CHARSET=UTF8 但仍然作为 unicode 字符串返回?

有什么方法可以使用连接参数本身来限制它?

我不想调用额外的函数来将我的 unicode 转换为普通字符串。

import pyodbc as p

connstr= 'DRIVER={SQL Server};SERVER=USERNAME\SQLEXPRESS;DATABASE=TEST;Trusted_Connection=yes;unicode_results=True;CHARSET=UTF8'
conn = p.connect(connstr)
print conn
cursor = conn.cursor()
result = cursor.execute("select * from employee1")
for each in result:
    print each
4

1 回答 1

6

您无法在连接字符串中处理此问题。SQL Server 的 odbc 连接设置中没有 CHARSET 属性,因此这对您没有任何好处。

您遇到的总体问题是数据库中的数据是 unicode。该列的数据类型是 nvarchar,它是包含国际数据字符的扩展(UTF-16 ... 可能是 windows 中的 UC-2,不记得了)数据类型。

您的选择是通过选择查询中的强制转换来转换数据,例如:

SELECT CAST(fieldname AS VARCHAR) AS fieldname

或在python中转换它,例如:

# to utf-8
row.fieldname.encode('utf8')

# to ascii, ignore non-utf-8 characters
row.fieldname.encode('ascii', 'ignore')

# to ascii, replace non-utf-8 characters with ?
row.fieldname.encode('ascii', 'replace')

如果您不需要国际字符,那么您可以将数据存储在 varchar 而不是 nvarchar 中。

于 2013-06-03T19:12:29.213 回答