我有各种类似(但不相同)的数据库,并且想使用 SQLAlchemy 作为“标准化”访问的一种方式。数据库可能略有不同,例如在列名上具有唯一前缀,或者它们可能差异更大并且缺少列(或者对于旧数据库,缺少整个表)。
我正在寻求帮助的不是 SQLAlchemy 问题,而是 Python/组织问题。我怎样才能有多个可以在项目中轻松重用的数据库设置?
我已经阅读了有关 SQLAlchemy 会话的信息,但是如果不在每个项目中实例化它们中的每一个,就看不到使用它们的方法。
我的问题是:如何制作一个模块/包,其中包含许多要在 SQLAlchemy 中使用的数据库模型设置,这些设置可以很容易地在另一个 python 项目中导入/使用?
到目前为止,我还不太担心处理丢失的列/表。我可以稍后解决这个问题,但需要牢记这一点,因为我不能为每个数据库使用完全相同的模型。
任何有关此主题的资源、指针或阅读材料都将不胜感激。在此先感谢,如果这已在其他地方得到回答,我很抱歉,搜索没有显示与此相关的任何内容。
编辑:我原封不动地保留了原件,并根据保罗的建议添加了更多内容。
RE: SA ORM - 是的,我打算使用 SQLAlchemy ORM。由于可能显而易见的原因,我无法提供真实的数据库。但是,假设这三个虚构的数据库,恰当地命名为 DB1、DB2 和 DB3(我们将假设每个数据库中只有一个表,只有几列,现实世界中两者的数量会多得多)。
每个数据库都有一个用户表,每个表中都有几列。以下是表/列的一些 SQL 表示法:
DB1.user --> DB1.user.id, DB1.user.username, DB1.user.email
DB2.user --> DB2.user.id, DB2.user.user_name, DB2.user.email
DB3._user --> DB3._user.userid, DB3._user.username, DB3.user.email_address
目前,我正在尝试将这些数据库分离为“模块化”,并且可以随时添加其他数据库。
我考虑了几个不同的文件组织方面(假设 __init__.py 在需要的地方存在,但为简洁起见省略),包括:
Databases | Databases | Databases
DB1.py | DB1 | DB1
DB2.py | models.py | models
DB3.py | DB2 | user.py
| models.py | anothertable.py
| DB2 | ...
| models.py | DB3
| | models
| | user.py
| | anothertable.py
我希望能够使用 SA ORM 访问这些,并且在需要在 python 文件中使用这些数据库时尽可能少地导入/声明。需要做类似的事情:
from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker
from Database import DB1, ..., DB[N]
db1_engine = create_engine('connect_string/db1')
db1_session = sessionmaker(bind=db1_engine)()
...
db3_engine = create_engine('connect_string/db3')
db3_session = sessionmaker(bind=db3_engine)()
将非常麻烦,因为我将处理的不仅仅是三个数据库。我宁愿已经为我处理好了(在 __init__.py 文件中,也许?)
能够访问和使用它类似于:
import Databases
Databases.DB1.session.query('blahblah')
会更好。
EDIT2:我也知道在设置我的模型时如何绕过数据库/列的命名约定中的变体。这不是问题,但我确实提到了它,以便知道我不能只为多个数据库使用一个模型集。
我希望通过扩展这一点,我不会混淆水域或让这变得太混乱。感谢您花时间阅读它!
EDIT3:我已经设法在这上面多花一点时间。我已经通过以下方式设置了项目:
Databases
__init__.py
databases.py
settings.py
DB1
__init__.py
models.py
...
DB3
__init__.py
models.py
目前,我在 settings.py 文件中“安装”了一组数据库。每个条目都是想要的INSTALLED_DATABASES = ('DB1', ..., 'DB3')
。随着我完成更多模型,它们被添加到元组列表中。这使我可以随时添加或删除内容。
我在 models.py 文件中设置了引擎和 sessios,并将每个数据库设置的init.py文件设置为from models import *
.
在 databases.py 文件中,我有以下内容
class Databases(object):
def __init__(self):
for database in INSTALLED_DATABASES:
setattr(self, database, __import__(database))
我现在可以通过以下方式使用这些:
from databases import Databases
db = Databases()
for qr in db.DB1.query(db.DB1.User):
print qr.userid, qr.username
SQLAlchemy 允许我在定义模型时手动指定列名,这对我想要的标准化来说是一个巨大的好处。
我还有很多工作要做。我想创建强制模型验证的对象(即,是否存在字段?不存在的字段是否具有默认值?等等)并更好地结合它与我的 IDE 的工作方式(目前还没有)。但我走上了正确的轨道。我想我会为任何可能想知道如何做同样事情的人更新这个。
对不起,这已经变得这么长了!
干杯!