我发现谷歌搜索结果好坏参半。我需要解析 SPSS .sav 文件以发现数据布局并提取调查结果。第一步是读取数据的“模式”。例如,我需要知道问题及其允许回答的类型。我计划在我自己的 SQL 表中对这些数据进行建模,这样我就可以根据我的应用程序要求对其进行切片和切块。第二步是用受访者的答案填充我的数据模型。查看 SPSS sav 文件,我相信它具有我正在寻找的两种类型的数据。
如果我不严格要求,我不需要也不想要昂贵的 SPSS 软件。我们不会对这些数据进行统计,只是根据答案过滤器选择受访者的子集。SPSS 文件将由获得 SPSS 许可的合作伙伴公司提供。我不需要将任何数据输出回 SPSS;我的用例是只读的。
我可以在我的解析器程序中使用 Python、Java 和 Groovy,C/C++。该程序将在数据收集结束时运行一次,因此性能并不是特别重要。理想情况下,我希望我的代码是跨平台的,这样我就可以在我的 Mac 上开发并部署到 Linux,但如果必须的话,我可以使用 windows,
我发现的很多东西要么是 2004 年的 java 类,要么是需要 IBM 的 DLL 并且是特定于 Windows 的现代 Python 代码。根据我对需求的快速解释,我将感谢 SO 社区的建议。我认为我的需求很简单,但还没有找到我所希望的。一个开源库是理想的,但我什至会以合理的价格购买一个简单的商业解决方案。