羽化文件旨在一次写入。因此,附加到它们不是受支持的用例。
相反,我会向您推荐如此大的数据集,使用or将数据写入单个Apache Parquet 文件,并使用pyarrow.parquet.write_table
orpandas.DataFrame.to_parquet
将数据读回 Pandas 。这些函数可以将 Parquet 文件的集合视为一个单独的数据集,该数据集可以一次读取到单个 DataFrame 中。pyarrow.parquet.ParquetDataset
pandas.read_parquet