首先,请参阅此 url ,了解我正在格式化的数据类型的一个小示例。您会注意到我在工作表中突出显示了我要选择的两个区域。随着项目进出数据集,选择范围需要是动态的。对于第一部分,我认为这段代码就足够了:
library(tidyverse)
library(readxl)
filename <- "MyDataset.xlsx"
#obtain first section of my excel spreadsheet
project_codes <- read_excel(
path = filename,
sheet = "Jan18",
range = "A10:B1000",
col_names = c("proj_num", "name")
) %>%
drop_na() %>%
filter(grepl("-", project_codes$proj_num))
第二部分是我被绊倒的地方......我想确保我在电子表格的另一个突出显示区域中选择了与我的“project_codes”完全相同的行子集。
我有许多以完全相同的方式格式化的工作表(并且命名约定是一致的 - Jan18、Feb18、Mar18),所以如果有人可以在解决第 1 部分后帮助我遍历工作表,则可以加分。