使用 resume_parser python 模块读取文件时出现 Tika Server Jar 文件错误。文件格式为 pdf/doc/docx。它发出警告:
2021-05-22 18:12:05,899 [MainThread ] [INFO ] Retrieving http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.24/tika-server-1.24.jar.md5 to C:\Users\Users\AppData\Local\Temp\tika-server.jar.md5.
INFO:tika.tika:Retrieving http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.24/tika-server-1.24.jar.md5 to C:\Users\Users\AppData\Local\Temp\tika-server.jar.md5.
ERROR:root:Error in docx file:: <urlopen error [WinError 10061] No connection could be made because the target machine actively refused it>
Python 脚本
from resume_parser import resumeparse
data = resumeparse.read_file(file)
- 尝试如下设置环境变量:它不起作用。
TIKA_SERVER_JAR = http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.24/tika-server-1.24.jar。
- 尝试下载jar文件并在环境变量中设置该路径,这也不起作用。
预期输出是包含简历中详细信息的字典,例如电子邮件、技能、电话号码、大学、公司信息等,
它在前几次有效,然后我收到了这个错误。