我正在使用-package 从 PDF 文件中提取表格extract_tables
。tabulizer
一切正常,但如果表格的标题少于 4 行,则不会被提取。如果表格超过 4 行,则它被正确提取。
这是我使用的代码:
text <- extract_tables("file path, file name")
table <- do.call(rbind, text)
table <- as.data.frame(table)
我还尝试了固定区域的解决方案:
text <- extract_tables("file path, file name", area = c(0,0,595,842))
但在这种情况下,某些列丢失并且某些列被合并。
有人遇到过同样的问题并知道如何解决吗?