1

我有一个 parquet 文件,其中包含结构列表,我似乎无法使用任何可用的 python parquet 库读取它。其中一些返回错误,指出尚不支持“结构列表”,而其他只是使用 None 对象制作 pandas 数据框。如果有人对此有任何经验,那将有很大帮助。在过去的几天里,我一直在用这个来敲打我的头。有没有其他方法可以以某种方式以编程方式读取文件或将该文件转换为其他格式然后读取它?

我希望可以使用不涉及调用或启动其他服务(如 Spark)的 Python 调用 python 本机支持或 c 库。

4

1 回答 1

0

尝试卸载 pyarrow 并安装 fastparquet。这对我有用。我试图使用熊猫将其转换为 CSV。

于 2020-09-02T10:04:05.990 回答