7

我正在使用Ubuntu 9.04

我已经安装了以下软件包版本:

unixodbc and unixodbc-dev: 2.2.11-16build3
tdsodbc: 0.82-4
libsybdb5: 0.82-4
freetds-common and freetds-dev: 0.82-4
python2.6-dev

我是这样配置/etc/unixodbc.ini的:

[FreeTDS]
Description             = TDS driver (Sybase/MS SQL)
Driver          = /usr/lib/odbc/libtdsodbc.so
Setup           = /usr/lib/odbc/libtdsS.so
CPTimeout               = 
CPReuse         = 
UsageCount              = 2

我是这样配置/etc/freetds/freetds.conf的:

[global]
    tds version = 8.0
    client charset = UTF-8
    text size = 4294967295

31e2fae4adbf1b2af1726e5668a3414cf46b454f我已从中获取pyodbc 修订版并使用“ ”http://github.com/mkleehammer/pyodbc安装它python setup.py install

我的本地网络上有一台装有Microsoft SQL Server 2000的 Windows 机器,启动并监听本地 IP 地址 10.32.42.69。我有一个名为“Common”的空数据库。我有用户“sa”,密码为“secret”,拥有完全权限。

我正在使用以下 python 代码来设置连接:

import pyodbc
odbcstring = "SERVER=10.32.42.69;UID=sa;PWD=secret;DATABASE=Common;DRIVER=FreeTDS"
con = pyodbc.connect(odbcstring)
cur = con.cursor()

cur.execute("""
IF EXISTS(SELECT TABLE_NAME FROM INFORMATION_SCHEMA.TABLES
      WHERE TABLE_NAME = 'testing')
   DROP TABLE testing
""")
cur.execute('''
CREATE TABLE testing (
    id INTEGER NOT NULL IDENTITY(1,1), 
    myimage IMAGE NULL, 
    PRIMARY KEY (id)
)
    ''')
con.commit()

到目前为止一切正常。我在服务器上使用了 SQLServer 的企业管理器,新表就在那里。现在我想在表上插入一些数据。

cur = con.cursor()
# using web data for exact reproduction of the error by all.
# I'm actually reading a local file in my real code.
url = 'http://www.forestwander.com/wp-content/original/2009_02/west-virginia-mountains.jpg'
data = urllib2.urlopen(url).read()

sql = "INSERT INTO testing (myimage) VALUES (?)"

现在在我原来的问题上,我在使用时遇到cur.execute(sql, (data,))了问题,但现在我已经编辑了这个问题,因为按照下面 Vinay Sajip 的回答(谢谢),我将其更改为:

cur.execute(sql, (pyodbc.Binary(data),)) 
con.commit()

并且插入工作正常。我可以使用以下测试代码确认插入数据的大小:

cur.execute('SELECT DATALENGTH(myimage) FROM testing WHERE id = 1')
data_inside = cur.fetchone()[0]
assert data_inside == len(data)

完美通过!

现在问题在于检索数据。

我正在尝试常见的方法:

cur.execute('SELECT myimage FROM testing WHERE id = 1')
result = cur.fetchone()
returned_data = str(result[0]) # transforming buffer object
print 'Original: %d; Returned: %d' % (len(data), len(returned_data))
assert data == returned_data

然而那失败了!!

Original: 4744611; Returned: 4096
Traceback (most recent call last):
  File "/home/nosklo/devel/teste_mssql_pyodbc_unicode.py", line 53, in <module>
    assert data == returned_data
AssertionError

我把上面的所有代码都放在了一个文件中以便于测试任何想要帮助的人。

现在的问题:

我希望 python 代码将图像文件插入 mssql。我想查询图像并将其显示给用户。

我不关心 mssql 中的列类型。我IMAGE在示例中使用“”列类型,但任何二进制/blob 类型都可以,只要我得到未损坏的插入文件的二进制数据。Vinay Sajip 在下面说,这是 SQL SERVER 2000 中的首选数据类型。

现在正在插入数据而没有错误,但是当我检索数据时,只返回 4k。(数据在 4096 被截断)。

我怎样才能使它工作?


编辑:Vinay Sajip 下面的回答给了我在现场使用 pyodbc.Binary 的提示。我已经相应地更新了这个问题。谢谢维奈萨吉普!

Alex Martelli 的评论让我想到了使用DATALENGTHMS SQL 函数来测试数据是否已完全加载到列上。谢谢亚历克斯马泰利!

4

3 回答 3

5

呵呵,刚出完悬赏,我就找到了解决办法。

您必须SET TEXTSIZE 2147483647在查询中使用,除了/etc/freetds/freetds.conf.

我用过

cur.execute('SET TEXTSIZE 2147483647 SELECT myimage FROM testing WHERE id = 1')

一切正常。

奇怪的是FreeTDS 文档关于文本大小配置选项的说法:

的默认值TEXTSIZE,以字节为单位。对于textimage数据类型,设置任何返回列的最大宽度。参照。set TEXTSIZET-SQL您的服务器的文档中。

配置还说最大值(和默认值)是 4,294,967,295。但是,当尝试在查询中使用该值时出现错误,我可以在查询中使用的最大数字是 2,147,483,647(一半)。

从那个解释我认为只设置这个配置选项就足够了。事实证明我错了,在查询中设置 TEXTSIZE 解决了这个问题。

以下是完整的工作代码:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import pyodbc
import urllib2

odbcstring = "SERVER=10.32.42.69;UID=sa;PWD=secret;DATABASE=Common;DRIVER=FreeTDS"
con = pyodbc.connect(odbcstring)
cur = con.cursor()

cur.execute("""
IF EXISTS(SELECT TABLE_NAME FROM INFORMATION_SCHEMA.TABLES
      WHERE TABLE_NAME = 'testing')
   DROP TABLE testing
""")

cur.execute('''
CREATE TABLE testing (
    id INTEGER NOT NULL IDENTITY(1,1), 
    myimage IMAGE NULL,
    PRIMARY KEY (id)
)
    ''')

con.commit()
cur = con.cursor()
url = 'http://www.forestwander.com/wp-content/original/2009_02/west-virginia-mountains.jpg'
data = urllib2.urlopen(url).read()

sql = "INSERT INTO testing (myimage) VALUES (?)"
cur.execute(sql, (pyodbc.Binary(data),))
con.commit()

cur.execute('SELECT DATALENGTH(myimage) FROM testing WHERE id = 1')
data_inside = cur.fetchone()[0]
assert data_inside == len(data)

cur.execute('SET TEXTSIZE 2147483647 SELECT myimage FROM testing WHERE id = 1')
result = cur.fetchone()
returned_data = str(result[0])
print 'Original: %d; Returned; %d' % (len(data), len(returned_data))
assert data == returned_data
于 2009-07-02T11:20:33.863 回答
3

我认为您应该使用pyodbc.Binary实例来包装数据:

cur.execute('INSERT INTO testing (myimage) VALUES (?)', (pyodbc.Binary(data),))

检索应该是

cur.execute('SELECT myimage FROM testing')
print "image bytes: %r" % str(cur.fetchall()[0][0])

更新:问题在于插入。将插入 SQL 更改为以下内容:

"""DECLARE @txtptr varbinary(16)

INSERT INTO testing (myimage) VALUES ('')
SELECT @txtptr = TEXTPTR(myimage) FROM testing 
WRITETEXT testing.myimage @txtptr ?
"""

我还更新了在检索代码中使用 value 属性时所犯的错误。

通过此更改,我能够将 320K JPEG 图像插入和检索到数据库中(检索到的数据与插入的数据相同)。

NB数据类型已被弃用,并在 SQL Server 的更高版本中image被替换。varbinary(max)但是,插入/检索的相同逻辑应该适用于较新的列类型。

于 2009-06-29T19:58:17.580 回答
1

我在字段上遇到了类似的4096截断问题,这对我来说是固定的,但这也为我解决了:TEXTSET TEXTSIZE 2147483647

import os
os.environ['TDSVER'] = '8.0'
于 2011-08-04T14:56:53.603 回答