我在我的 PyCharm venv 中使用 Python 3.6 解释器,并尝试将 CSV 转换为 Parquet。
import pandas as pd
df = pd.read_csv('/parquet/drivers.csv')
df.to_parquet('output.parquet')
Error-1 ImportError:无法找到可用的引擎;尝试使用:'pyarrow'、'fastparquet'。拼花支持需要 pyarrow 或 fastparquet
解决方案-1 安装了 fastparquet 0.2.1
错误 2 文件“/Users/python parquet/venv/lib/python3.6/site-packages/fastparquet/compression.py”,第 131 行,在 compress_data(算法,排序(压缩)))中 RuntimeError: Compression 'snappy'无法使用。选项:['GZIP','未压缩']
我安装了python-snappy 0.5.3但仍然出现同样的错误?我需要安装任何其他库吗?
如果我使用PyArrow 0.12.0引擎,我不会遇到这个问题。