1

是否可以在不打开或创建 hdf5 文件的情况下创建 PyTables 表?我的意思是,我需要的是在不同的进程中创建一个表(实际上非​​常多的表),使用这些表并在经过一些计算后才将表存储到一个 hdf5 文件中(并确保只有一个进程一次执行存储)。

原则上,我可以对普通 Python 数据(数组字符串等)进行所有计算并最终执行存储。但是,为什么我会很高兴从一开始就使用 PyTables 是完整性检查。我想始终确保我使用的数据适合预定义的表并且不违反形状约束等(并且由于 PyTables 检查这些问题,我不需要自己实现它)。

非常感谢和亲切的问候,罗伯特

4

2 回答 2

1

您正在寻找具有出色 Pytables 集成的pandas。您将一直使用表格,最后您将能够以最简单的方式保存到 hdf5。

于 2013-05-18T12:07:41.037 回答
0

您可以创建具有给定形状和数据类型的 numpy 数组。

my_array = num.empty(shape=my_shape, dtype=num.float)

如果您需要按名称索引,请查看 numpy record-arrays (nee numpy recarray )

但是,如果您直接使用 PyTable-Object,它会更快(请参阅此处的基准)。

于 2013-05-18T12:10:24.230 回答