6

我无法从 MSSQL 服务器获取有效字符串到 python。我相信某处存在编码不匹配。我相信它位于 ODBC 层和 python 之间,因为我能够在 tsql 和 isql 中获得可读的结果。

pyodbc 期望什么字符编码?我需要在链中进行哪些更改才能使其正常工作?

具体例子

这是一个简化的python脚本作为示例:

#!/usr/bin/env python
import pyodbc

dsn = 'yourdb'
user = 'import'
password = 'get0lddata'
database = 'YourDb'

def get_cursor():
    con_string = 'DSN=%s;UID=%s;PWD=%s;DATABASE=%s;' % (dsn, user, password, database)
    conn = pyodbc.connect(con_string)
    return conn.cursor()

if __name__ == '__main__':
    c = get_cursor()
    c.execute("select id, name from recipe where id = 4140567")

    row = c.fetchone()
    if row:
        print row

这个脚本的输出是:

(Decimal('4140567'), u'\U0072006f\U006e0061\U00650067')

或者,如果脚本的最后一行更改为:

print "{0}, '{1}'".format(row.id, row.name)

那么结果是:

Traceback (most recent call last):
  File "/home/mdenson/projects/test.py", line 20, in <module>
    print "{0}, '{1}'".format(row.id, row.name)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)

使用tsql执行相同查询的脚本:

root@luke:~# tsql -S cmw -U import -P get0lddata
locale is "C"
locale charset is "ANSI_X3.4-1968"
using default charset "UTF-8"
1> select id, name from recipe where id = 4140567
2> go
id      name
4140567 orange2
(1 row affected)

以及在isql中:

root@luke:~# isql -v yourdb import get0lddata
SQL>  select id, name from recipe where id = 4140567
+----------------------+--------------------------+
| id                   | name                     |
+----------------------+--------------------------+
| 4140567              | orange2                  |
+----------------------+--------------------------+
SQLRowCount returns 1
1 rows fetched

所以我早上一直在做这个工作,看起来高高低低,还没有弄清楚有什么问题。

细节

以下是版本详细信息:

  • 客户端是 Ubuntu 12.04
  • freetds v0.91
  • unixodbc 2.2.14
  • 蟒蛇2.7.3
  • pyodbc 2.1.7-1(来自 ubuntu 包)和 3.0.7-beta06(从源代码编译)

  • 服务器是带有 SQL Server Express 2008 R2 的 XP

下面是客户端上几个配置文件的内容。

/etc/freetds/freetds.conf

[global]
    tds version = 8.0
    text size = 64512
[cmw]
    host = 192.168.90.104
    port = 1433
    tds version = 8.0
    client charset = UTF-8

/etc/odbcinst.ini

[FreeTDS]
Description = TDS driver (Sybase/MS SQL)
Driver = /usr/lib/x86_64-linux-gnu/odbc/libtdsodbc.so
Setup = /usr/lib/x86_64-linux-gnu/odbc/libtdsS.so
CPTimeout =
CPReuse =
FileUsage = 1

/etc/odbc.ini

[yourdb]
Driver = FreeTDS
Description = ODBC connection via FreeTDS
Trace = No
Servername = cmw
Database = YourDB
Charset = UTF-8
4

3 回答 3

2

因此,在继续工作之后,我现在将 unicode 字符输入 python。不幸的是,我偶然发现的解决方案就像亲吻你的表弟一样令人满意。

我通过安装 python3 和 python3-dev 包然后用 python3 重建 pyodbc 解决了这个问题。

现在我已经完成了这个,我的脚本现在可以工作了,即使我仍然使用 python 2.7 运行它们。

所以我不知道这样做解决了什么问题,但它现在可以工作了,我可以继续我开始的项目。

于 2012-12-18T19:55:06.153 回答
1

您是否有可能遇到 BOM(字节顺序标记)问题?如果是这样,也许这段代码会有所帮助:

import codecs
if s.beginswith( codecs.BOM_UTF8 ):
    # The byte string s begins with the BOM: Do something.
    # For example, decode the string as UTF-8

if u[0] == unicode( codecs.BOM_UTF8, "utf8" ):
    # The unicode string begins with the BOM: Do something.
    # For example, remove the character.

# Strip the BOM from the beginning of the Unicode string, if it exists
u.lstrip( unicode( codecs.BOM_UTF8, "utf8" ) )

我在这个页面上找到了那个片段。

于 2012-12-12T00:19:20.620 回答
0

如果将 pyodbc 升级到版本 3,问题将得到解决。

于 2013-09-03T16:26:29.367 回答