sqlalchemy
我最近在 Python 中发现了。我想将它用于数据科学而不是网站应用程序。
我一直在阅读它,我喜欢你可以将 sql 查询翻译成 Python。
我正在做的主要困惑是:
由于我正在从一个已经很完善的模式中读取数据,我希望我不必自己创建相应的模型。
我能够绕过读取表的元数据,然后只查询表和列。问题是当我想加入其他表时,每次读取元数据都需要很长时间,所以我想知道将它缓存在对象中是否有意义,或者是否有另一种内置方法。
编辑: 包括代码。注意到等待时间是由于加载功能中的错误,而不是如何使用引擎。仍然留下代码以防人们评论有用的东西。干杯。
我正在使用的代码如下:
def reflect_engine(engine, update):
store = f'cache/meta_{engine.logging_name}.pkl'
if update or not os.path.isfile(store):
meta = alq.MetaData()
meta.reflect(bind=engine)
with open(store, "wb") as opened:
pkl.dump(meta, opened)
else:
with open(store, "r") as opened:
meta = pkl.load(opened)
return meta
def begin_session(engine):
session = alq.orm.sessionmaker(bind=engine)
return session()
然后我使用元数据对象来获取我的查询......
def get_some_cars(engine, metadata):
session = begin_session(engine)
Cars = metadata.tables['Cars']
Makes = metadata.tables['CarManufacturers']
cars_cols = [ getattr(Cars.c, each_one) for each_one in [
'car_id',
'car_selling_status',
'car_purchased_date',
'car_purchase_price_car']] + [
Makes.c.car_manufacturer_name]
statuses = {
'selling' : ['AVAILABLE','RESERVED'],
'physical' : ['ATOURLOCATION'] }
inventory_conditions = alq.and_(
Cars.c.purchase_channel == "Inspection",
Cars.c.car_selling_status.in_( statuses['selling' ]),
Cars.c.car_physical_status.in_(statuses['physical']),)
the_query = ( session.query(*cars_cols).
join(Makes, Cars.c.car_manufacturer_id == Makes.c.car_manufacturer_id).
filter(inventory_conditions).
statement )
the_inventory = pd.read_sql(the_query, engine)
return the_inventory