5

我有两个 SQLite 数据库,其中包含我需要使用 SQLalchemy 加入的表。由于某些原因,我无法将所有表合并到一个 SQLite 数据库中。我正在使用 SQLalchemy ORM。我无法在网上找到任何符合我具体情况的解决方案。

我的问题原则上与SQLAlchemy error query join across database相同,但原始发帖人的问题是使用与我的用例不匹配的不同解决方案解决的。

我对 Stackoverflow 的聪明人的问题:

我想模拟以下 SQL 查询:

SELECT DISTINCT g.gene_symbol, o.orthofinder_id FROM eukarya.genes AS g JOIN annotations.orthofinder AS o ON g.gene_id=o.gene_id;

此查询使用附加了两个数据库文件的 SQliteStudio 可以正常工作。

我目前用来描述元数据的代码:

eukarya_engine = create_engine('sqlite:///eukarya_db.sqlite3')
annotations_engine = create_engine('sqlite:///eukarya_annotations_db.sqlite3')

meta = MetaData()  # This allows me to define cross database foreign keys

Eukarya = declarative_base(bind=eukarya_engine, metadata=meta)
Annotations = declarative_base(bind=annotations_engine, metadata=meta)
# I did the above in the hopes that by binding the engines this way,
# would percolate through the schema, and sqlalchemy would be able
# figure out which engine to use for each table.

class Genes(Eukarya):
  """SQLalchemy object representing the Genes table in the Eukarya database."""
  __tablename__ = 'genes'
  gene_id = Column(Integer, primary_key=True, unique=True)
  gene_symbol = Column(String(16), index=True)
  taxonomy_id = Column(Integer, ForeignKey(Species.taxonomy_id), index=True)
  original_gene_id = Column(String)

class Orthofinder(Annotations):
  """SQLalchemy object representing the Orthofinder table in the Annotations database."""
  __tablename__ = 'orthofinder'
  id = Column(Integer,primary_key=True, autoincrement=True)
  gene_id = Column(Integer, ForeignKey(Genes.gene_id), index=True)
  orthofinder_id = Column(String(10), index=True)

Session = sessionmaker()
session = Session(bind=eukarya_engine)

print(session.query(Genes.gene_symbol,Orthofinder.orthofinder_id).
      join(Orthofinder).all().statement)

最后一个打印语句返回:

sqlalchemy.exc.OperationalError: (sqlite3.OperationalError) no such table: orthofinder [SQL: 'SELECT genes.gene_symbol AS genes_gene_symbol, orthofinder.orthofinder_id AS orthofinder_orthofinder_id \nFROM genes JOIN orthofinder ON genes.gene_id = orthofinder.gene_id']

如果我能够以某种方式将两个数据库引擎绑定到一个会话,我相信我的麻烦就结束了。但是怎么做?对于连接到同一引擎的两个数据库(例如 MySQL 数据库中的两个数据库),我可以添加__table_args__ = {'schema': 'annotations'}(根据sqlalchemy 中的 Cross database join),但在 SQLite 的情况下我无法弄清楚这一点。

我更喜欢一种解决方案,它允许我的代码的用户构建查询,而不必知道每个表驻留在哪个数据库中。

请帮忙!并提前非常感谢!

4

1 回答 1

4

回答我自己的问题(感谢 Ilja 找到解决方案):

我可以这样定义引擎:

engine  = create_engine('sqlite://',echo=True)  # generate in mem database to attach mutitple sqlite databases to.
engine.execute("attach database 'eukarya_db.sqlite3' as eukarya;")
engine.execute("attach database 'eukarya_annotations_db.sqlite3' as annotations;")

然后添加

__table_args__ = {'schema': 'eukarya'}

或者

__table_args__ = {'schema': 'annotations'}

到我的餐桌课。

奇迹般有效!

于 2017-11-03T11:29:23.293 回答