1

问题是我有一个横向格式化的 PDF 文档,其中包含三列文本,我试图使用 readtext() 将其读入 R。当它读入文本时,不是按顺序向下读每一列,而是在同一行文本的列之间读取。

简而言之,如果每列的第一行只是 1-10 的一串数字,第二行是 11-20 的字符串,则 readtext() 将其读入为“1234567891012345678910”而不是“1234567891011121314.. 。“ ETC。

有没有办法指定 readtext() 在我的导入过程中跟随列?

最好的,丹尼尔

4

1 回答 1

1

(当前)答案是否定的。readtext使用 pdftools 包来读取 pdf,这不能识别单独的列。这与用于阅读 pdf 的 poppler 有关。另请参阅github 上的问题 4 。它有点内,pdf_data但不容易检索。

于 2019-12-14T15:21:36.913 回答