是否可以从 Python 中的不同进程编写相同的 Parquet 文件夹?
我用fastparquet
.
它似乎有效,但我想知道_metadata
如果两个进程同时写入文件,文件如何不会发生冲突。
另外,为了使其正常工作,我必须使用ignore_divisions=True
这对于稍后在阅读 Parquet 文件时获得快速性能来说并不理想,对吗?
是否可以从 Python 中的不同进程编写相同的 Parquet 文件夹?
我用fastparquet
.
它似乎有效,但我想知道_metadata
如果两个进程同时写入文件,文件如何不会发生冲突。
另外,为了使其正常工作,我必须使用ignore_divisions=True
这对于稍后在阅读 Parquet 文件时获得快速性能来说并不理想,对吗?