1

我通过 Haven 包导入到 R 的 spss 数据集有一个不寻常的问题(我还在GitHub 上发表了一篇关于此的帖子)。数据集充满了具有缺失值定义的变量,这些变量不包含在值标签中,这会导致 R 中的错​​误。-77 被定义为缺失值,但不是值标签。索引变量的列返回

Error: `x` and `labels` must be same type

我发现解决此问题的唯一方法是应用标签,删除缺失值,然后删除标签:

ds <- read_spss(sav.file, user_na=TRUE)
val_label(ds[[1]], -77) <- "temp"
na_values(ds[[1]]) <- NULL 
val_label(ds[[1]], -77) <- NULL

该解决方案依赖于双括号(或 $)。我想知道将其应用于大型数据集中的所有数字变量的最快方法是什么。我可以使用 for 循环轻松地做到这一点,但我正在寻找更快的东西。

4

0 回答 0