我使用以 Python .npz 格式存储的数组。我有很多这样的文件,它们都共享相同的公共结构:文件名my_file_var1_var2_var3.npz
包含以下项目(所有数组都是 32 位浮点数):
- 一个二维数组(N=11,Ns=2000)
- 一个二维数组 (12, N )
- 一个二维数组 ( 300, N )
- 一个二维数组( 300, Ns )
- 一个浮子
- 一个整数
拥有超过 1000 个文件是很烦人的,而且每个文件最终都会占用大约 4Mb。我在想最好将它们转移到一个容器中,比如 HDF5/Pytables 或类似的。不同的数组只是数组,没有优先排序或任何东西(它们实际上是矩阵或将被操作的向量堆栈)。每个文件名的所有数组都需要同时在一起。
是否有任何关于哪种格式可以更好地检索与 和 关联的数组的建议var1
,var2
以及var3
存储的便携和高效