我正在尝试通过搜索某些关键字来对 pdf 进行一些文本挖掘。
这是我的代码:
library(pdftools)
library(tidyverse)
library(pdfsearch)
UC_text <- pdf_text("https://wilmar-iframe.todayir.com/attachment/20190411162436345449392_en.pdf")
result <- keyword_search(UC_text,
keyword = c('SUBSTANTIAL SHAREHOLDERS'),
path = TRUE, surround_lines = 1)
但是,我收到文件名太长的错误消息。我怎样才能克服这个问题?