0

我正在编写一个实用程序,我打算将它用于至少三个不同的数据库服务器后端(SQLite3、PostgreSQL 和 MySQL)。我没有使用 ORM(尽管我在完成原型后尝试使用 SQLAlchemy 进行 fork,并且对如何维护架构以供其他工具可能访问(将来可能来自其他语言)足够熟悉)。

我本着 StackOverflow 关于回答自己的问题并打开问题并回答讨论的政策的精神发布此内容。

下面答案中发布的代码已经针对所有三个支持的目标进行了测试,这些目标预先配置了我预期架构的一个非常简单的子集(脚本顶部附近的硬代码)。它目前仅检查每个表是否具有所有必需的列,并且仅在存在额外列时发出警告。我不检查列内容的类型或其他约束。

(我的实用程序应该允许最终用户添加其他列,只要它们允许 NULL 值或代码提供合适的默认值 --- 因为我的代码只会插入或更新我指定的列的子集)。

请让我知道是否有更好的方法来实现这一点,或者我是否犯了一些在我的测试中没有发现的严重错误。

(我想知道如何正确创建可以共享的SQLFiddle条目/链接,以使这个问题更容易处理。欢迎任何关于此的指针,我已经尝试在这里为我的 MySQL 模式创建这个.. .让我们看看这是否有效)。

4

1 回答 1

1

如上所述,这是我的方法:

#!/usr/bin/env python
import importlib
import sys

schema = (('tags',     set(('id','tag','gen','creation'))),
          ('nodes',    set(('name', 'id', 'gen', 'creation'))),
          ('node_tag', set(('node_id', 'tag_id', 'creation'))),
          ('tgen',     set(('tid', 'comment', 'creation')))
         )

drivers = {
           'mysql':  'MySQLdb',
           'pg':     'psycopg2',
           'sqlite': 'sqlite3',
          }

if __name__ == '__main__':
    args = sys.argv[1:]
    if args[0] in drivers.keys():
        dbtype = args[0]
        db = importlib.import_module(drivers[dbtype])
    else:
        print >> sys.stderr, 'Unrecognized dbtype %s, should be one of these:' % args[0], ' '.join(drivers.keys())
        sys.exit(127)

    if dbtype == 'sqlite':
        required_args = 2
        dbopts = { 'database': args[1] }
    else:
        required_args = 6
        dbopts = { 'database' : args[1],
                   'user'     : args[2],
                   'passwd'   : args[3],
                   'host'     : args[4],
                   'port'     : int(args[5]),
                }

if len(args) < required_args:
    print >> sys.stderr, 'Must supply all arguments:',
    print >> sys.stderr, '[mysql|pg|sqlite] database user passwd host port'
    sys.exit(126)

if dbtype == 'mysql':
    dbopts['db'] = dbopts['database']
    del dbopts['database']

if dbtype == 'pg':
    dbopts['password'] = dbopts['passwd']
    del dbopts['passwd']

try:
    conn = db.connect(**dbopts)
except db.Error, e:
    print 'Database connection failed: %s' % e
    sys.exit(125)

cur  = conn.cursor()

exit_code = 0
for each_table in schema:
    table, columns = each_table
    introspected_columns = None
    try:
        cur.execute("SELECT * FROM %s WHERE 0=1" % table)
        introspected_columns = set((x[0] for x in cur.description))
    except db.Error, e:
        print >> sys.stderr, 'Encountered %s Error on table %s' % (e, table)
    if introspected_columns:
        missing = columns - introspected_columns
        extra   = introspected_columns - columns
    if missing:
        print 'Error: Missing columns in table %s: %s' % (table,' '.join(missing))
        exit_code += 1
    else:
        print 'All columns present for table %s' % table
    if extra:
        print 'Warning: Extra columns in table %s: %s' % (table, ' '.join(extra))

sys.exit(exit_code)

...在实际实践中,这将被重构为一个类,并在我正在编写的守护程序的服务启动期间调用。

注意这里的实际技术是对所有列进行查询SELECT * FROM some_table......但保证不返回任何行WHERE 0=1......这意味着我不需要提前知道任何表名。这似乎始终如一地在 DBAPI(客户端)游标中设置 DBAPI cur.description字段。

(顺便说一下,这个例子还强调了流行的 DBAPI 数据库驱动程序中连接关键字参数的一些令人讨厌的差异。它们似乎都没有忽略额外的键,所以我们需要为这三个中的每一个设置显着不同的参数;只是 SQLite3 的文件名,并更改对于 MySQLdb,'database' 键的名称为 'db',对于 PostgreSQL,'password' 为 'passwd' ---至少对于psycopg2驱动程序而言)。

于 2014-07-02T08:49:06.867 回答