3

我正在尝试将 SPSS 样式类别标签应用于我在 R 中的数据集。我认为我的问题出现了,因为我不知道如何正确解析变量,因此不一定只与这些类型的数据相关。首先,按照expss库文档手动执行此操作可以正常工作:

library(expss)

#Load in the data
data(mtcars)

#Apply Variable Labels and Value Labels (and Numeric Coding) to each Variable.
mtcars = apply_labels(mtcars,
                      vs = "Engine",
                      vs = c("V-engine" = 1,
                             "Straight engine" = 2,
                             "Other engine" = 3)
)

现在,如果我将“变量名称”、“变量标签”、“值标签”和相应的“值数字代码”存储在某些 R 数据类型中,并且我尝试在apply_labels函数中使用它们,就会出现我的问题。例如,如果我将这些存储在字符向量中,如下所示:

#Load in the data
data(mtcars)

#Value Labels
value_lab<-c("V-engine","Straight engine","Other engine")
#Value's Numeric coding
value_num<-c("1","2","3")

#Variable names
var <- c("vs")
#Variable Labels
var_lab<-c("Engine")

那么我的问题是,我将如何在函数中使用我的字符向量元素apply_labels?例如,我将如何做这样的事情:

#Apply Variable Labels and Value Labels (and Numeric Coding) to each Variable.
mtcars = apply_labels(mtcars,
                      var[1] = var_lab[1],
                      var[1] = c(value_lab[1] = value_num[1],
                                 value_lab[2] = value_num[2],
                                 value_lab[3] = value_num[3])
)

我尝试了各种组合,paste但都toString没有成功。我的下一步是将其应用于我的 500,000+ 行 x 20,000 列数据,其中可能的值标签/数字编码数量待定。强制性:我是 R 的新手。谢谢。

4

2 回答 2

4

为了达到你想要的结果

  1. 利用命名列表和向量来存储变量和值标签
  2. 这样做您可以使用do.call将变量和值标签传递给apply_labels

为了使示例更有趣,我为第二个变量添加了标签。

library(expss)

# Variable Labels
var_labels <- list(vs = "Engine", am = "Transmission")
#Value Labels
val_labels <- list(
  vs = c("V-engine" = 0, "Straight engine" = 1),
  am = c("Automatic" = 0, "Manual" = 1)
)

mtcars2 <- do.call(apply_labels, c(list(data = mtcars), var_labels, val_labels))

table(mtcars2$am, mtcars2$vs)
#>            
#>             V-engine Straight engine
#>   Automatic       12               7
#>   Manual           6               7
于 2020-12-21T11:39:57.937 回答
0

太好了谢谢!这使我了解了命名列表并使用setNames.

我最终没有使用expss. 它似乎在 R 中工作并按预期标记了所有内容,但是当我使用 将最终数据帧从 R 导出到 SPSShaven::write_sav时,值标签没有被维护(但变量标签是)。

相反,我使用haven 标记的矢量类来应用变量和值标签。我的最终解决方案如下所示:

#Load in the data
data(mtcars)

#Variables
var <- c("vs")
#Variable Labels
var_labels<-c("Engine")

#Value Labels (for first Variable)
value_labs<-c("V-engine","Straight engine","Other engine")
#Value's Numeric coding )
value_num<-c("1","2","3")

#Make a named list to use as the value labels
value_labels <- setNames(as.integer(value_num),value_labs)

#Apply the label with haven
mtcars[,c(var[1])]<-labelled(mtcars[, c(var[1])],
                              labels=value_labels,
                              label=var_labels[1])

#Save out in spss format
haven::write_sav(mtcars, "test.sav")

另外,我已经进行了设置,因此我的数据一次包含一组值标签,但是您扩展到第二个变量的示例也帮助我概括了这一点,再次感谢!

于 2020-12-22T06:04:27.040 回答