在使用 tabulizer 和 pdftools 从 pdf 中提取信息时,我有时想根据正则表达式模式匹配索引大量 df 列表。
a <- data.frame(yes=c("pension"))
b <- data.frame(no=c("other"))
my_list <- list(a,b)
我想使用 str_detect 返回与模式“养老金”匹配的基础 df 索引。
所需的输出将是:
index <- 1 (based on which and str_detect)
new_list <- my_list[[index]]
new_list
yes
1 pension
如何检测底层 df 中的模式,然后返回使用一直很困难的索引。我看到以前的讨论使用循环和 if-then 语句,但使用 purrr 的解决方案似乎更受欢迎。