1

我在 Mac 上的 R 中的以下 pdf 中使用 Tabulizer 0.2.2 extract_tables。

销售<-“ http://www.greenwichct.org/upload/medialibrary/5cd/Residential-Sales-by-Address-10-10-to-10-15.pdf

测试 <- extract_tables(sales,pages=c(1:10),method="decide")

我相信每一页上的表格都是相同的,但是例如前十页的矩阵结果列表给出了具有 3 个不同维度的矩阵。列有时会连接,例如在 test[[3]] 中与列 1 和 2。

我试过设置区域,指定方法。我四处寻找如何指定列参数,但找不到任何具体的东西。甚至使用了 extract_area(),但结果相同。使用 Tabula 应用程序也存在同样的问题。

任何想法表示赞赏。

4

0 回答 0