2

我创建了一个脚本来使用 tabula-py 和 PyPDF2 从 pdf 中提取数据。当我通过 Jupyter-notebook 和 cmd 运行我的程序时,它运行良好。使用 pyinstaller 将其转换为可执行文件后,出现此错误:

Error: Unable to access jarfile 
E:\Users\paulhong\AppData\Local\Temp\_MEI175522\tabula\tabula-1.0.2-jar-with-dependencies.jar
Error:
Traceback (most recent call last):
File "test.py", line 115, in <module>

File "test.py", line 32, in extractDataDik
tempDf = tabula.read_pdf(file, area = (72, 252, 115.2, 352.8), guess=False, pages='1')
File "site-packages\tabula\wrapper.py", line 108, in read_pdf
File "subprocess.py", line 395, in check_output
File "subprocess.py", line 487, in run
subprocess.CalledProcessError: Command '['java', '-Dfile.encoding=UTF8', '-jar', 
'E:\\Users\\paulhong\\AppData\\Local\\Temp\\_MEI175522\\tabula\\tabula-1.0.2-jar-with-dependencies.jar', '--pages', '1', '--area', 
'72,252,115.2,352.8', 'E:\\Users\\paulhong\\Desktop\\Purchase Order 
2\\SKM_C45819060508450 (003).pdf']' returned non-zero exit status 1. [47140] Failed to execute script test

我也找不到指定路径上的文件夹 _MEI175522。

我的python版本是3.7.1 Java版本是1.8 pyinstaller版本是3.4 Tabula-py是最新版本

我该如何解决这个问题?

4

2 回答 2

4

我有一个类似的问题,我能够使用此链接上的解决方案来解决它:无法访问 jarfile 'tabula-1.0.2-jar-with-dependencies.jar'

我在虚拟环境中构建了我的应用程序,因此我在我的文件tabula夹中添加了一个包含该tabula-1.0.2-jar-with-dependencies.jar文件的文件site-packages夹。运行该命令pyinstaller --add-data apps\Lib\site-packages\tabula\tabula-1.0.2-jar-with-dependencies.jar;tabula --onefile Table_OCR.py可以为我正确构建可执行文件。

于 2019-08-29T22:50:58.273 回答
0

看起来 tabula 模块没有被复制到可执行文件的 dist 文件夹中,根据我的经验,这是 pyinstaller 的一个常见问题,它经常会丢失 python 目录中的包。

转到 dist 文件夹并检查 tabula 文件夹是否存在,如果没有,则需要将其复制过来。

转到你的 python 目录,它应该是这样的: C:\Users\<user_name>\AppData\Local\Programs\Python\Python37-32\Lib\site-packages

从这里复制任何需要在 dist 文件夹中的包

于 2019-06-13T13:55:53.917 回答