r - Tabulizer 提取缺失

翻译自：https://stackoverflow.com/questions/43276750 2017-04-07T11:13:24.723

553 次

我正在使用-package 从 PDF 文件中提取表格extract_tables。tabulizer一切正常，但如果表格的标题少于 4 行，则不会被提取。如果表格超过 4 行，则它被正确提取。

这是我使用的代码：

text <- extract_tables("file path, file name")
table <- do.call(rbind, text)
table <- as.data.frame(table)

我还尝试了固定区域的解决方案：

text <- extract_tables("file path, file name", area = c(0,0,595,842))

但在这种情况下，某些列丢失并且某些列被合并。

有人遇到过同样的问题并知道如何解决吗？

0 回答 0