2

使用 Have ::labelled 动态创建值标签的后续问题,其中akrun使用deframe.

我正在使用 Haven::labelled 来设置变量的值标签。目标是创建一个完整记录的数据集,我可以导出到 SPSS。

现在,假设我有一个 dfvalue_labels值及其值标签。我还有一个 df df_data,其中包含我想要分配值标签的变量。

value_labels <- tibble(
  value = c(seq(1:6), seq(1:3), NA),
  labels = c(paste0("value", 1:6),paste0("value", 1:3), NA),
  name = c(rep("var1", 6), rep("var2", 3), "var3")
)


df_data <- tibble(
  id = 1:10, 
  var1 = floor(runif(10, 1, 7)),
  var2 = floor(runif(10, 1, 4)), 
  var3 = rep("string", 10)
)

df_data$var1手动,我会像这样创建价值标签df_data$var2

df_data$var1 <- haven::labelled(df_data$var, labels = c(values1 = 1, values2 =  2, values3 = 3, values4 = 4, values5 = 5, values6 = 6))

df_data$var2 <- haven::labelled(df_data$var, labels = c(values1 = 1, values2 =  2, values3 = 3))

我需要一种更动态的方式来为大型数据集中的正确变量分配正确的值标签。该解决方案还需要忽略character向量,因为我不希望这些具有值标签。因此,var3invalue_labels被列为NA

该解决方案不需要处理列表中的多个数据集。

4

1 回答 1

1

这是一个选项,我们split在删除行后通过“名称”命名“值/标签” NA,使用名称list来子集“df_data”的列,应用labelled并将其分配回相同的列

lbls2 <- na.omit(value_labels)
lstLbls <- with(lbls2, split(setNames(value, labels), name))
df_data[names(lstLbls)] <- Map(haven::labelled, 
          df_data[names(lstLbls)], labels = lstLbls)
df_data
# A tibble: 10 x 4
#      id       var1       var2 var3  
#   <int>  <dbl+lbl>  <dbl+lbl> <chr> 
# 1     1 2 [value2] 2 [value2] string
# 2     2 5 [value5] 2 [value2] string
# 3     3 4 [value4] 1 [value1] string
# 4     4 1 [value1] 2 [value2] string
# 5     5 1 [value1] 1 [value1] string
# 6     6 6 [value6] 2 [value2] string
# 7     7 1 [value1] 3 [value3] string
# 8     8 1 [value1] 1 [value1] string
# 9     9 3 [value3] 3 [value3] string
#10    10 6 [value6] 1 [value1] string
于 2019-12-17T14:52:48.847 回答