问题标签 [h5py]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1172 问题

0 投票

1 回答

3495 浏览

python - 我无法使用 h5py 读回数据。“无法创建组”

我正在尝试完成快速入门页面上的简单示例

http://www.h5py.org/docs/intro/quick.html

输出是

我是否试图正确地做到这一点？

python h5py

2013-03-04T00:51:59.050

0 投票

1 回答

1064 浏览

python - h5py 何时可用于存储数据？

我正在使用 h5py 使用 python 存储数据

存储这些大数字真的很有用但是当试图只存储两列数据时，我发现保存普通数据文件更节省空间。是否存在临界数据大小，超过该大小的 h5py 格式存储会更有效？使用这种格式还有其他不明显的优势吗？

python h5py

2013-03-16T08:06:34.907

0 投票

1 回答

941 浏览

python - 在 h5py 或类似的分层数据库中快速搜索

我需要一个用于在线目录的数据库；如果每个产品可能有一个数据集。和一个简单的数据库；这就是我喜欢 h5py 的原因。

分组的方法visititems对于大文件来说并不快。

使用不评估任何内容的函数（通过）“database.visititems(fu01)”需要 5 秒。使用基本参数进行过滤需要 x2。

我的问题是如何搜索一个大型或非常大的 h5py 数据库按特征过滤，并且非常快（10.000 个产品不到 0.1 秒）。

h5py/hdf5 是正确的方法，还是需要像 sqlite3 这样的 sql 数据库？

或者，当需要速度时，所有这些都必须在同一个数据集中？以树路径为一个元素。例如：

然后按一个“列”（高级切片）过滤所有产品。

我是数据库新手，目前我对在内存中工作的数据库不感兴趣，比如 reddis 或类似的；因为很难同步数据的变化。但是如果没有其他解决方案...

python database h5py

2013-04-04T21:14:08.347

0 投票

2 回答

5220 浏览

python - 使用 h5py 压缩现有文件

我目前正在研究一个关于压缩 HDF5 数据集的项目，最近开始使用 h5py。我遵循了基本教程，并且能够在创建文件时打开、创建和压缩文件。但是，在压缩现有文件时我一直没有成功（这是我工作的目标）。

我尝试使用 'r+' 打开文件，然后压缩分块数据集，但文件大小保持不变。

关于使用哪些命令或我以错误的方式处理事情的任何建议？

python compression hdf5 h5py

2013-04-09T13:54:57.640

0 投票

1 回答

1761 浏览

python - 带有版本控制的 HDF5 文件 (h5py) - 每次保存时都会更改哈希值

我正在使用 h5py 将来自数值工作的中间数据存储在 HDF5 文件中。我的项目处于版本控制之下，但这不适用于 HDF5 文件，因为每次重新运行生成 HDF5 文件的脚本时，即使其中的数据没有，二进制文件也会更改。

这是一个小例子来说明这一点：

我查看了 HDF5 文件格式文档和 h5py 文档，但没有找到任何对我有帮助的东西。我的问题是：

即使我保存相同的数据，为什么文件会更改？
我怎样才能停止它的变化，所以版本控制只会在实际数字内容发生变化时看到文件的新版本？

谢谢

python hdf5 h5py

2013-04-15T15:59:06.140

0 投票

1 回答

12933 浏览

python - Updating h5py Datasets

Does any one have an idea for updating hdf5 datasets from h5py? Assuming we create a dataset like:

Is it possible to extend the dset to a 3x3 numpy array?

python hdf5 h5py

2013-04-25T11:26:48.080

0 投票

2 回答

536 浏览

python - 多线程python hdf5解析函数时速度没有提升

我有一个功能：

1) 将 hdf5 数据集作为整数 ascii 码读入

2) 将 ascii 整数转换为字符...chr() 函数

3) 将字符连接成单个字符串函数

在进行分析时，我发现绝大多数计算都花在了第 2 步上，即将 ascii 整数转换为字符。我通过使用以下方法对这个调用进行了一些优化：

由于我的解析函数似乎受 cpu 限制（整数到字符的转换）而不是 i/o 限制，我希望通过专用于解析的内核数量获得或多/少的线性速度增强。连续解析一个文件需要约 15 秒...解析 10 个文件（在我的 12 核机器上）需要约 150 秒，同时使用 10 个线程。也就是说，似乎根本没有增强。

我使用以下代码来启动我的线程：

任何帮助将不胜感激。

python multithreading hdf5 h5py

2013-04-30T14:32:10.993

0 投票

5 回答

48683 浏览

python - 如何在 HDF5 数据集中存储字典

我有一本字典，其中键是日期时间对象，值是整数元组：

我想将它存储在 HDF5 数据集中，但如果我尝试只转储字典 h5py 会引发错误：

TypeError: Object dtype dtype('object') has no native HDF5 equivalent

转换此字典以便我可以将其存储在 HDF5 数据集中的“最佳”方法是什么？

具体来说，我不想只是将字典转储到 numpy 数组中，因为它会使基于日期时间查询的数据检索复杂化。

python h5py

2013-05-11T07:01:53.843

0 投票

3 回答

6142 浏览

hdf5 - h5py 可以从内存中的字节数组加载文件吗？

我的 python 代码正在接收一个字节数组，它代表 hdf5 文件的字节。

我想将此字节数组读取到内存中的 h5py 文件对象，而无需先将字节数组写入磁盘。这个页面说我可以打开一个内存映射文件，但这将是一个新的空文件。我想从字节数组到内存中的 hdf5 文件，使用它，丢弃它，而不是在任何时候写入磁盘。

可以用 h5py 做到这一点吗？（或者如果这是唯一的方法，则使用 C 使用 hdf5）

hdf5 h5py

2013-05-20T16:45:59.733

0 投票

1 回答

2147 浏览

python - 在 matplotlib 中使用动画的颜色图问题

我用来matplotlib.animation为名为arr. 我使用库从 h5 文件中读取数据h5py，一切正常。但是在使用动画时，颜色图卡在数据范围的第一帧中，经过一些步骤后，它在绘图时显示非标准化颜色。

这是我的代码：

python animation matplotlib color-mapping h5py

2013-05-20T19:56:35.377

1 2 3 4 5 6 7 8 9 10

问题标签 [h5py]

Reference