0

什么是用于自动化或半自动化(即提供良好开端)从 SPSS 等统计包中获取矩形数据的过程的好工具,并且:

  • 以数据库可以读取的文本格式保存主要矩形数据
  • 为其他参考表保存附加文件(例如值标签)
  • 使用 SQL 起草(可能是手工修饰)脚本或批处理文件以在数据库中创建表和列并将文本文件作为相关表中的数据行导入?

我怀疑完全自动化是可能的,但这一定是一个相当普遍的任务。我们有大约十几个这样的数据集,其中一些有几百个变量,我们想在关系数据库(Oracle,如果这有什么不同的话)中设置它们。除了高昂的成本之外,手工操作没有概念上的困难。

我觉得肯定有这样的工具可用,但我显然在错误的地方搜索或使用了错误的术语。

(编辑 - 添加了 R 标签,因为在我自己对此的回答中,我将它用作解决方案的一部分)

4

2 回答 2

1

在 SPSS Statistics 中,输出管理系统 (OMS) 可以将任何输出表捕获为数据集。统计数据可以将数据集直接写回数据库,也可以将其保存为 CSV 文件或其他格式。后者见保存翻译。

HTH,乔恩·派克

于 2012-08-29T21:18:47.387 回答
0

好的,经过进一步调查(并感谢我给出的答案,虽然不完全有帮助),我现在赞成:

  1. 将数据带入 R 例如使用外部包
  2. 为我需要的每个参考表创建一个数据框
  3. as.numeric()orunclass()版本替换原始因子,所以它只是数字,而不是标签
  4. sqlSave()使用RODBC 包将主要数据和参考表保存到数据库中。

像这样的一个小功能促进了第 2 步:

factorToRef <- function(x, field){
    tmp <- levels(x)
    tab <- data.frame(1:length(tmp), tmp)
    names(tab) <- paste(field, c("_ID","_NAME"), sep="")
    tab
}

哪个可以给出类似的结果

> data(iris)
> factorToRef(iris$Species, "species" )
  species_ID species_NAME
1          1       setosa
2          2   versicolor
3          3    virginica

这是要保存在数据库中的参考表的基础。

于 2012-09-09T02:38:45.510 回答