0

情况

我有一个用 PHP 编写的网站。

在 PHP 中,我可以提取上传到同一网站的 pdf 文件中的文本等。

我找到了tabula-java github repo。

那么问题是什么?

我已经尝试过用于 tabula 的 mac 应用程序。我注意到在转换表格数据之前,我需要突出显示 pdf 的某个部分。

然而,这不是我想要完成的。我想在后台按需运行 tabula。当我的网站收到文件上传并满足某些条件时,我想以某种方式调用表格即服务并将非结构化数据提供给它,然后取回表格数据。

我该怎么做呢?

4

1 回答 1

0

一种方法是包装tabula-extractor命令行命令并将结果返回到您的应用程序中。

例如,在 R 中,tabulizer包以这种方式工作。

于 2016-05-02T13:21:39.070 回答