7

是否可以将数据帧从 Apache Spark 导出到羽毛(https://github.com/wesm/feather)文件?

4

1 回答 1

2

不确定,您可以直接执行此操作,但您可以先将 Spark Dataframe(在 pyspark 上)转换为 pandas 并将其存储到 Feather:

pandas_df = spark_df.toPandas()

feather.write_feather(pandas_df, 'example_feather')

但我担心,这会对性能产生影响。

于 2018-10-17T10:54:11.053 回答