问题标签 [hdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
92 浏览

python-2.7 - 在 Pandas 中合并 DataFrame 列的正确方法?

目前我做的是:

虽然这可行,但我想知道是否有其他更快的内置方法来处理这种情况?我这样做的原因是因为在不同的数据集中,我有不同数量的具有相关信息的列,我想将它们合并到一列/行中,以便我可以对它们进行频率/平均值计算。

再次感谢大家的支持!

0 投票
1 回答
427 浏览

fortran - 使用 gfortran 和 HDF-EOS2 库编译程序

我有将 HDF-EOS 库链接到 Fortran90 程序的问题。我已将库从源代码编译到 $prefix 中指定的目录。我的简单编译命令是:

编译时,我收到以下错误:

在我不应该更改的程序中,HDF-EOS 库是通过 external 关键字使用的,例如

在库中,nm $prefix/lib/libhdfeos.a | grep gdopen给我:

使用-fno-underscoring编译时,我得到一个不同的错误:

那么错误是:

此外,gfortran 会找到这些库,否则它会抱怨。错误与下划线有关吗?我还能尝试什么?我在 Fedora 和 gfortran 版本 4.7.2 上工作。

0 投票
2 回答
3002 浏览

python - 从 HDF5 文件中删除数据集属性

我有一个 hdf5 文件,我想通过删除其中一个数据集的属性来修改并保存文件而不进行进一步更改。我可以在 hdfview 中做到这一点,但我需要一些可编写脚本的东西,因为它需要应用于大量文件。

我尝试使用 h5py 在 python 中编写脚本:

但我收到以下错误:

回溯(最后一次调用):文件“”,第 1 行,文件“/usr/lib/python2.7/dist-packages/h5py/_hl/attrs.py”,第 75 行,delitem h5a.delete(self ._id, self._e(name)) 文件“h5a.pyx”,第 135 行,在 h5py.h5a.delete (h5py/h5a.c:2682) KeyError:“无法删除属性(属性:无法删除消息) )"

print dSet.attrs['myAttrName']产生正确的值,证明我可以访问该属性。

还有其他方法可以做到这一点吗?也许使用 h5repack?

0 投票
0 回答
263 浏览

relational-database - HDF5 数据库设计查找表与冗余数据的存储

我研究过几个规模相当小的遗留 HDF5 数据库,每个数据库都利用分组来执行查找。例如,作为一个人为的例子,假设我有一个二维数据集,其中每个单元格映射回一个组,该组可以存储另一个数据集,该数据集保存与原始数据集中包含的 ID 对应的数据。这很好,但一个项目基本上在关系数据库类型系统中使用 hdf5。(数据集包含要打开的组的值-> 组包含告诉我要打开的数据集名称的属性-> 最终获取数据)

由于 hdf5 具有内置压缩功能,因此存储冗余数据(例如复合数据类型)会带来更多收益。

当然,这取决于数据的要求/复杂性,但总的来说,在 HDF5 中存储冗余数据是不好的做法吗?

0 投票
2 回答
88 浏览

package - /usr/lib64/libhdf5* 与 /usr/lib64/openmpi/lib/libhdf5*

在我们的 RHEL 6.6 机器上,我们安装了以下两个包

这些似乎提供了我认为是重复的库(即 libhdf5.so.6.0.4),但执行 md5sum 显示它们并不相同。

1)这是一个不好的做法/实际问题吗?我们的一位用户声称拥有这样的重复库会给他带来依赖的噩梦。

2)假设这是一个问题,我们如何“修复”它?删除一个或另一个可能会对依赖我们删除的包的其他人造成破坏。

0 投票
1 回答
295 浏览

matlab - 用于 HDF 数据的 Matlab 批处理 - 无法打开文件错误

用于 HDF 数据的 Matlab 批处理给出了错误。如果我使用单一操作,它会完美运行。但不能批量操作。我的代码在这里

错误是

0 投票
0 回答
892 浏览

python - 格式=表时的 hdf5 错误,pandas pytables

似乎我得到一个错误,format=table但没有错误format=fixed。这是命令。奇怪的是它似乎仍然在加载数据。我只需要想办法克服这个问题。没有任何错误会让我高枕无忧。数据框经过预处理,在列中设置类型。

我运行的命令是:

hdf = pd.HDFStore('path-to-file')

hdf.put('df',df,format='table')

我得到的错误是:

0 投票
1 回答
1210 浏览

c - 可以从 C 或 Fortran 读取 .Rdata 文件格式吗?

我正在编写一些关于 C 的 R 扩展(要从 R 调用的 C 函数)。

我的代码需要同时使用 2 个不同的数据集计算统计数据,并且我需要使用所有可能的配对组合来执行此操作。然后,我需要所有这些统计数据(非常大的数组)来继续 C 端的计算。这些文件非常大,通常约为 40GB,这就是我的问题。

要在 R 调用的 C 上执行此操作,首先我需要加载 R 中的所有数据集以将它们传递给 C 函数调用。但是,理想情况下,如果我能够直接从 C 或 Fortran 访问数据集,则可以按照顺序在内存中同时维护其中的 2 个文件:

这在 R 上很好,因为我可以加载/卸载文件,但是在调用 C 或 Fortran 时,我没有任何机制来加载/卸载文件。所以,我的问题是,我可以直接从 Fortran 或 C 读取 .Rdata 文件,能够打开/关闭它们吗?还有其他解决问题的方法吗?

据我所读,答案是否定的。所以,我正在考虑从 Rdata 迁移到 HDF5。

0 投票
1 回答
437 浏览

pandas - Querying a HDF-store

I created a hd5 file by

I have a list that contains numpy.datetime64 values called expirations and try to read the portion of the hd5 table into a dataframe, that has values between expirations[1] and expirations[0] in column "expiration". Column expiration entries have the format Timestamp('2002-05-18 00:00:00').

I use the following command:

However, I get ValueError: Unable to parse x How should this be correctly done?

There is more columns but they aren't of interest for the query.

0 投票
1 回答
428 浏览

python - 从 Python 中读取 3D HDF 的特定 Z 分量切片

有谁知道如何修改以下代码,以便我可以在 Python 中读取 3D hdf 数据的特定 z 分量切片?从附图中可以看出,z 值从 0 到 160,我只想绘制“80”。尺寸为400x160x160。这是我的代码。

在此处输入图像描述