1

使用 resume_parser python 模块读取文件时出现 Tika Server Jar 文件错误。文件格式为 pdf/doc/docx。它发出警告:

2021-05-22 18:12:05,899 [MainThread  ] [INFO ]  Retrieving http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.24/tika-server-1.24.jar.md5 to C:\Users\Users\AppData\Local\Temp\tika-server.jar.md5.
INFO:tika.tika:Retrieving http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.24/tika-server-1.24.jar.md5 to C:\Users\Users\AppData\Local\Temp\tika-server.jar.md5.
ERROR:root:Error in docx file:: <urlopen error [WinError 10061] No connection could be made because the target machine actively refused it>

Python 脚本

from resume_parser import resumeparse

data = resumeparse.read_file(file)
  1. 尝试如下设置环境变量:它不起作用。

TIKA_SERVER_JAR = http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.24/tika-server-1.24.jar

  1. 尝试下载jar文件并在环境变量中设置该路径,这也不起作用。

预期输出是包含简历中详细信息的字典,例如电子邮件、技能、电话号码、大学、公司信息等,

它在前几次有效,然后我收到了这个错误。

4

0 回答 0