0

sqlalchemy我最近在 Python 中发现了。我想将它用于数据科学而不是网站应用程序。
我一直在阅读它,我喜欢你可以将 sql 查询翻译成 Python。
我正在做的主要困惑是:

由于我正在从一个已经很完善的模式中读取数据,我希望我不必自己创建相应的模型。
我能够绕过读取表的元数据,然后只查询表和列。问题是当我想加入其他表时,每次读取元数据都需要很长时间,所以我想知道将它缓存在对象中是否有意义,或者是否有另一种内置方法。

编辑: 包括代码。注意到等待时间是由于加载功能中的错误,而不是如何使用引擎。仍然留下代码以防人们评论有用的东西。干杯。

我正在使用的代码如下:

def reflect_engine(engine, update):
  store = f'cache/meta_{engine.logging_name}.pkl'

  if update or not os.path.isfile(store):
    meta = alq.MetaData()
    meta.reflect(bind=engine)
    with open(store, "wb") as opened:
      pkl.dump(meta, opened)
  else: 
    with open(store, "r") as opened:
      meta = pkl.load(opened)
  return meta


def begin_session(engine):
  session = alq.orm.sessionmaker(bind=engine)
  return session()

然后我使用元数据对象来获取我的查询......

def get_some_cars(engine, metadata): 
  session = begin_session(engine)  

  Cars   = metadata.tables['Cars']
  Makes  = metadata.tables['CarManufacturers']

  cars_cols = [ getattr(Cars.c, each_one) for each_one in [
      'car_id',                   
      'car_selling_status',       
      'car_purchased_date', 
      'car_purchase_price_car']] + [
      Makes.c.car_manufacturer_name]

  statuses = {
      'selling'  : ['AVAILABLE','RESERVED'], 
      'physical' : ['ATOURLOCATION'] }

  inventory_conditions = alq.and_( 
      Cars.c.purchase_channel == "Inspection", 
      Cars.c.car_selling_status.in_( statuses['selling' ]),
      Cars.c.car_physical_status.in_(statuses['physical']),)

  the_query = ( session.query(*cars_cols).
      join(Makes, Cars.c.car_manufacturer_id == Makes.c.car_manufacturer_id).
      filter(inventory_conditions).
      statement )

  the_inventory = pd.read_sql(the_query, engine)
  return the_inventory
4

0 回答 0