12

我正在尝试学习如何将 peewee 与 mysql 一起使用。

我在具有现有表的 mysql 服务器上有一个现有数据库。该表目前是空的(我现在只是在测试)。

>>> db = MySQLDatabase('nhl', user='root', passwd='blahblah')
>>> db.connect()


>>> class schedule(Model):
...     date = DateField()
...     team = CharField()
...     class Meta:
...             database = db

>>> test = schedule.select()
>>> test
<class '__main__.schedule'> SELECT t1.`id`, t1.`date`, t1.`team` FROM `nhl` AS t1 []
>>> test.get()

我收到以下错误:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.6/site-packages/peewee.py", line 1408, in get
    return clone.execute().next()
  File "/usr/lib/python2.6/site-packages/peewee.py", line 1437, in execute
    self._qr = QueryResultWrapper(self.model_class, self._execute(), query_meta)
  File "/usr/lib/python2.6/site-packages/peewee.py", line 1232, in _execute
    return self.database.execute_sql(sql, params, self.require_commit)
  File "/usr/lib/python2.6/site-packages/peewee.py", line 1602, in execute_sql
    res = cursor.execute(sql, params or ())
  File "/usr/lib64/python2.6/site-packages/MySQLdb/cursors.py", line 201, in execute
    self.errorhandler(self, exc, value)
  File "/usr/lib64/python2.6/site-packages/MySQLdb/connections.py", line 36, in defaulterrorhandler
    raise errorclass, errorvalue
_mysql_exceptions.OperationalError: (1054, "Unknown column 't1.id' in 'field list'")

为什么 peewee 将“id”列添加到选择查询中?我的表中没有数据库中已经存在的 id 列。我只是想使用现有的表,而不是依赖 peewee 每次我想与数据库交互时都必须创建一个。这就是我认为错误所在的地方。

查询的结果应该是空的,因为表是空的,但是因为我正在学习,我只是想尝试一下代码。我感谢您的帮助。

编辑

基于 Wooble 和 Francis 的有益回应,我开始怀疑使用 peewee 或其他 ORM(如 sqlalchemy)对我来说是否有意义。使用 ORM 而不是仅使用 MySQLdb 在 python 中运行直接查询有什么好处?

这是我期望做的:

- 自动从各种网络服务器下载数据。大多数数据是 xls 或 csv 格式。我可以使用 xlrd 包将 xls 转换为 csv。

- 在插入/批量插入 mysql 数据库表之前解析/处理列表对象中的数据。

- 运行复杂的查询以将数据从 mysql 导出到 python 到适当的数据结构(例如列表)中,用于各种统计计算,这在 python 中而不是 mysql 中更容易完成。可以在 mysql 中完成的任何事情都将在那里完成,但我可能会在 python 中运行复杂的回归。

- 对从查询中检索到的数据运行各种图形包。其中一些可能包括使用 ggplot2 包(来自 R-project),这是一个高级图形包。所以我将涉及一些 R/Python 集成。

鉴于上述情况 - 我最好花几个小时学习 ORM/Peewee/SQLAlchemy 还是坚持使用 MySQLdb 直接查询 mysql?

4

4 回答 4

16

大多数简单的活动记录模式 ORM 都需要一个id列来跟踪对象身份。PeeWee 似乎是其中之一(或者至少我不知道有任何方法可以使用 id)。如果不更改表格,您可能无法使用 PeeWee。

无论如何,您现有的表似乎设计得不是很好,因为它似乎缺少键或复合键。每个表都应该有一个关键属性——否则就不可能区分一行和另一行。

如果这些列之一是主键,请尝试按照有关非整数主键的文档中的primary_key=True说明添加参数

date = DateField(primary_key=True)

如果您的主键未命名id,那么您必须在该表的 peewee 模型中将表的实际主键设置为“PrimaryKeyField()”类型。

您应该调查使用数据映射器模式的SQLAlchemy 。它更复杂,但也更强大。它对你的 SQL 表设计没有任何限制,事实上它在大多数情况下可以自动反映你的表结构和相互关系。(在 MySQL 中可能不太好,因为外键关系在默认表引擎中不可见。)对您来说最重要的是,它可以处理缺少键的表。

于 2013-03-22T00:04:14.353 回答
10

如果您的主键列名称不是“id”,则应向该表模型类添加其他字段:

class Table(BaseModel):
    id_field = PrimaryKeyField()

这将告诉您的脚本,您的表的主键存储在名为“id_field”的列中,并且该列是启用了自动增量的 INT 类型。 是描述 peewee 中字段类型的文档。

如果您想对主键字段进行更多控制,正如 Francis Avila 已经指出的那样,您应该在创建字段时使用 primary_key=True 参数:

class Table(BaseModel):
    id_field = CharField(primary_key=True)

请参阅非整数主键文档上的此链接

于 2013-04-17T15:56:08.420 回答
3

您必须为此模型提供 primary_key 字段。如果您的表没有单个 primary_key 字段(就像我的一样),在 Meta 中定义的CompositeKey会有所帮助。

primary_key = peewee.CompositeKey('date', 'team')
于 2014-05-26T06:22:23.070 回答
0

您需要使用 peewee 的 create table 方法创建实际的数据库表,然后才能调用select(),这将在表中创建一个 id 列。

于 2013-03-21T22:39:22.423 回答