0

我有一个由爬虫创建的具有多个分区的表,我正在创建这样的数据框 glueContext.create_data_frame_from_catalog(database="123", table_name="123", push_down_predicate = predicate),从 api 获取谓词。是否存在从目录中获取所有数据的方法(不指定分区),但在某个地方能够访问分区信息(例如,作为数据框列)?这将是一个很大的优化,因为超过 2000 个分区为所有人创建数据帧是一个很大的开销。

4

0 回答 0