我正在清理数据库,其中一个字段是“国家”,但是数据库中的国家名称与我需要的输出不匹配。
我虽然使用 str_replace 函数,但我有超过 50 个国家需要修复,所以这不是最有效的方法。我已经准备了一个 CSV 文件,其中包含原始国家输入和我需要参考的输出。
这是我到目前为止所拥有的:
library(stringr)
library(dplyr)
library(tidyr)
library(readxl)
database1<- read_excel("database.xlsx")
database1$country<str_replace(database1$country,"USA","United States")
database1$country<str_replace(database1$country,"UK","United Kingdom")
database1$country<str_replace(database1$country,"Bolivia","Bolivia,Plurinational State of")
write.csv(database1, "test.csv", row.names=FALSE, fileEncoding = 'UTF 8', na="")