0

我正在使用此代码从我的 PDF 中提取数据:

tx <- pdf_text("Name.pdf")
tx2 <- unlist(str_split(tx, "[\\r\\n]+"))
tx3 <- str_split_fixed(str_trim(tx2), "\\s{2,}", 5)
write.csv(tx3, file="Path\\ds1.csv")

但这使用行尾来分隔 PDF。我想在每一段之后分开。我可以使用任何其他拆分功能来获取数据段落吗?

4

0 回答 0