我是这个平台的新手,希望有人可以帮助我。
我已经使用 pdftools 库将一些 pdf 文件导入 Rstudio。现在我想制作这个文本的结构化列。我似乎无法使结构正确。
这是我导入的一个添加文件的示例。我想在数据表中制作黄色阴影线。
这是我最终想要的结果。
现在我已经输入了下面的代码,但我无法将它放入数据表中。
library(pdftools)
library(stringr)
library(dplyr)
# load the PDF-files into Rstudio
files <- list.files(pattern = "pdf$", full.names = TRUE)
# make a list of the PDF-files
filestext <- lapply(files, pdf_text)
# remove "\n"
filestext <- str_split(filestext, pattern = "\n")
这是我得到的结果:
有谁知道解决这个问题的最简单方法?