0

我在单独的 .h5 文件(分层数据格式 5,HDF5)中有两组数据,是通过 python 脚本获得的,我想执行统计分析以找到它们之间的相关性。我在这里的经验是有限的;我不知道任何R。

我想将数据加载到 SPSS,但 SPSS 似乎不支持 .h5。去这里的最佳方式是什么?我可以将所有内容写入 .csv 文件,但我会丢失变量的名称。有没有办法在不丢失任何信息的情况下转换数据?为什么 SPSS 不支持 h5 呢?

我知道 Rpy 模块的存在。你认为学习 R 编程值得吗?这会给我与 SPSS 中相同的方法库吗?

谢谢您的意见!

4

1 回答 1

1

有没有办法在不丢失任何信息的情况下转换数据?

如果 HDF5 数据足够规则,您可以将其加载到 Python 或 R 中,然后将其再次保存为 CSV(如果您更喜欢冒险和/或关心性能,甚至可以使用 SPSS .sav 格式)。

为什么SPSS不支持h5?

谁知道。它可能应该。那好吧。

你认为学习 R 编程值得吗?

如果您发现 SPSS 有用,您可能还会发现 R 有用。既然您提到了 Python,您可能会发现它也很有用,但它更像是一种通用语言:更灵活,但不太关注数学和统计数据。

R 会给我与 SPSS 中相同的方法库吗?

可能,这取决于你在做什么。R 包含大多数数学和统计数据,包括可安装包中的一些相当深奥和/或新算法。它有一些 Python (目前)没有的东西,但 Python 也涵盖了许多用户的大部分基础。

于 2014-03-16T12:15:39.767 回答