0

我目前正在处理 CSV 文件和 mySQL 数据库之间的数据格式。我正在使用 MySQLdb 库来管理连接,但格式似乎有些问题。我不得不承认,我在 mySQL 或 Python 方面都不是很有经验,但是通过务实的方法,到目前为止,大多数人都做得很好。

#!/usr/bin/python
# -*- coding: utf-8 -*-

import MySQLdb 

QUERY = "SELECT * FROM searches WHERE searchdate BETWEEN '2011-08-08' AND '2011-08-14';"
conn = MySQLdb.connect (unix_socket = '/opt/local/var/run/mysql5/mysqld.sock',host =      "localhost", user = "username", passwd= "passwd", db="db")
c = conn.cursor()
c.execute(QUERY)
for row in c.fetchall():
    print row

这是从数据库中提取记录的脚本。在此过程的后期,我想从每一行中提取数据并将其格式化为 CSV,但目前我的问题是打印到屏幕上的数据如下所示:

('\xc3\xa6nima', ' 1', ' 12782027', ' 35', datetime.date(2011, 8, 13))
('\xc3\xa6nima', ' 1', ' 12823616', ' 59', datetime.date(2011, 8, 10))
('\xc3\xa6oc', ' 1', ' 13078573', ' 55', datetime.date(2011, 8, 14))
('\xc3\xa6re', ' 1', ' 12516300', ' 35', datetime.date(2011, 8, 8))
('\xc3\xa6re v\xc3\xa6re deg', ' 1', ' 13145801', ' 59', datetime.date(2011, 8, 13))
('\xc3\xa6re v\xc3\xa6re deg og lammet', ' 1', ' 13145801', ' 59', datetime.date(2011, 8, 13))
('\xc3\xa6re v\xc3\xa6re jesu navn', ' 1', ' 13136667', ' 59', datetime.date(2011, 8, 11))
('\xc3\xa6rlig vuggevise', ' 1', ' 12386933', ' 35', datetime.date(2011, 8, 12))
('\xc3\xa6ror aleina', ' 1', ' 12867037', ' 35', datetime.date(2011, 8, 12))
('\xc3\xa6sj', ' 1', ' 13130891', ' 59', datetime.date(2011, 8, 8))
('\xc3\xa6thenor', ' 1', ' 12555673', ' 35', datetime.date(2011, 8, 10))

我现在遇到的问题是我应该如何以兼容的格式获取数据。所以我想我想知道如何访问数据库中的字符集并将其更改为 UTF-8,以及是否需要重建所有数据,或者是否有自动处理此问题的方法。如果有人能指出我如何使用内置函数格式化 datatime.date 的方向,我也会非常高兴(我知道我可以正则表达式和重建,但可能有一个更优雅的解决方案)。

预先感谢您的帮助!

4

3 回答 3

1

在您的第一列中,某些字符不可打印,因此将其转换为十六进制字符。日期时间对象中的最后一列。Python 提供 strftime 函数将其转换为字符串。

for row in c.fetchall():
    print row[0], row[1], row[2], row[3], row[4].strftime('%Y-%m-%d')

将工作。

此外,您可以使用写入文件

file.write(",".join((row[0], row[1], row[2], row[3], row[4].strftime('%Y-%m-%d'))))

其中,文件是文件对象。它将写为逗号分隔的列。在这里,您可以在打开文件时看到文件中的原始字符。

于 2012-04-23T13:51:00.397 回答
1

我不熟悉 MySQLdb 但它应该是这样的

conn = MySQLdb.connect (unix_socket = '/opt/local/var/run/mysql5/mysqld.sock',host = "localhost", user = "username", passwd = "passwd", db="db", charset ="utf-8" )

确保您的数据库也可以使用 utf-8

使用 pypdbc 这看起来像

import pyodbc
con = pyodbc.connect('DRIVER={MySQL ODBC 3.51 Driver};SERVER=localhost;DATABASE=db;UID=user;PWD=blabla',charset='utf8', init_command='SET NAMES UTF8')
cursor = con.cursor()
str=u'''INSERT INTO migdal_hist VALUES("","2011/03/01","0","בלהבלה","0",","0","0")'''
cursor.execute(str.encode('utf-8'))
con.commit()
于 2012-04-23T15:42:15.883 回答
0

也许你需要这样的东西:

mysql = MySQLdb.connect(host = '...', [...] use_unicode = True)
cursor = mysql.cursor()
cursor.execute("SET NAMES 'utf8'")

让我们试试吧:)

于 2012-04-24T20:22:25.840 回答