0

我在python中有这段代码,我用它来打开子进程模块并继续从那里获取数据,但我不知道如何从不同的目录中对文件进行OCR。我已经尝试将完整的文件路径放到文件名应该在代码中的目录中,但它似乎并没有奏效。如何在 Tabula 中指定从哪个目录获取文件?

var = ['java', '-jar', 'tabula-0.9.0-jar-with-dependencies.jar','-p', '1', '-a', '35, 0, 800, 800','-c', '25, 55, 85, 115, 145, 185, 339, 363, 530', file]
4

1 回答 1

0

指定 PDF 文档的完整路径就足够了。此外,您可能会考虑使用tabula-py,它是tabula-java.

于 2017-08-02T21:01:39.680 回答