我正在构建一个流程,我需要定期导入 4 个大型 txt 数据集,这些文件包含多个变量,其代码值需要转换为有形值,即 title_code 01 = Manager。我创建了 12 个 rda 文件来支持转换,代码是不变的,但我需要定期刷新导入文件。
我没有看到任何为此目的使用 rda 文件的 dplyr 或 sqldf 示例,这似乎是存储临时表等数据的好方法,有没有更好的方法?
输入数据
id <- c(1,2,3,4)
name <- c("John","Bill","Mary","Cindy")
title_code <- c(1,2,3,4)
df1 <- data.frame(id,name,title_code)
title_code <- c(1,2,3,4)
title <- c("Manager", "Officer", "Sales", "VP")
df2 <- data.frame(title_code,title)
我可以用 rda 文件代替 df2
library(sqldf)
df3 = sqldf('select df1.id, df1.name, df2.title
from df1 left join df2
on df1.title_code = df2.title_code')
df3
预期结果