我有一个 pandas 数据框,名为df
.
我想以压缩格式保存它。一种方法如下:
import gzip
import pandas
df.save('filename.pickle')
f_in = open('filename.pickle', 'rb')
f_out = gzip.open('filename.pickle.gz', 'wb')
f_out.writelines(f_in)
f_in.close()
f_out.close()
但是,这需要我首先创建一个名为filename.pickle
. 有没有办法更直接地做到这一点,即不创建filename.pickle
?
当我想加载已被 gzip 压缩的数据框时,我必须完成创建 filename.pickle 的相同步骤。例如,要读取一个文件
filename2.pickle.gzip
,它是一个 gzipped pandas 数据帧,我知道以下方法:
f_in = gzip.open('filename2.pickle.gz', 'rb')
f_out = gzip.open('filename2.pickle', 'wb')
f_out.writelines(f_in)
f_in.close()
f_out.close()
df2 = pandas.load('filename2.pickle')
这可以在不filename2.pickle
先创建的情况下完成吗?