有什么方法可以将 SPSS 数据集导入 Python,最好是 NumPy recarray 格式?我环顾四周,但找不到任何答案。
俊
选项 1 正如 rkbarney 指出的,有 Python savReaderWriter 可通过 pypi 获得。我遇到了两个问题:
选项 2 我选择使用 R 作为中间人。使用 rpy2,我设置了一个简单的函数来将文件读入 R 数据帧并再次将其作为 CSV 文件输出,然后我将其导入 python。这有点 rube-goldberg 但它有效。当然,这需要 R,在您的环境中安装也可能很麻烦(并且对于不同的平台有不同的二进制文件)。
SPSS 与 Python 有广泛的集成,但它旨在与 SPSS(现在称为 IBM SPSS Statistics)一起使用。有一个 SPSS ODBC 驱动程序可以与 Python ODBC 支持一起使用来读取 sav 文件。
您可以让 Python 对spssread进行外部调用,这是一个以您想要的方式输出 SPSS 文件内容的 Perl 脚本。
需要明确的是,SPSS ODBC 驱动程序不需要安装 SPSS。
也许这会有所帮助:用于 spss sav 文件(Linux、Mac 和 Windows)的 Python 阅读器 + 编写器 http://code.activestate.com/recipes/577811-python-reader-writer-for-spss-sav-files-linux-苹果电脑-/