我想编译一个带有多个按年份(2016、2015、2014 等)标记的选项卡的 Excel 文件。每个选项卡都有相同的数据,但列名的拼写可能每年都不同。
我想在合并之前对每张表中的列进行标准化。
这是组合 usingpurrr
和readxl
用于此类任务的通用方式:
combined.df <- excel_sheets(my.file) %>%
set_names() %>%
map_dfr(read_excel, path = my.file, .id = "sheet")
...但是如前所述,这会为“COLUMN ONE”和“Column One”创建单独的列,它们具有相同的数据。
插入make.names
管道可能是最好的解决方案。
将它们放在一起将是理想的……例如:
combined.df <- excel_sheets(my.file) %>%
set_names() %>%
map(read_excel, path = my.file) %>%
map(~(names(.) %>% #<---WRONG
make.names() %>%
str_to_upper() %>%
str_trim() %>%
set_names()) )
..但是语法都是错误的。