我从 pandas 创建了一个数据框,并使用 to_parquet(...) 直接写入 s3。
论据是:
df.to_parquet('s3://bucket/fn.parquet', compression='gzip', engine='fastparquet', partition_cols=['col1'])
当我使用 pandas 时pandas.read_parquet(url)
,数据框加载正常。
但是当我使用时modin.pandas.read_parquet(url)
,我得到以下错误:
File "/home/mguo/anaconda3/envs/testenv/lib/python3.7/site-packages/s3fs/core.py", line 1779, in __init__
self.req_kw["IfMatch"] = self.details["ETag"]
KeyError: 'ETag'
以下是我的版本:
python==3.7.3
pandas==1.2.4
modin==0.10.0
s3fs==2021.6.0