1

我正在尝试在 python 中使用 Tika 来解析 PDF 文件。我正在使用 python 2.7 和 Mac。我无法让它工作。我已经安装了它,然后:

from tika import parser
raw = parser.from_file('...file')

我收到此错误(为简洁而编辑):

Retrieving http://search.maven.org/remotecontent ... to /var/folders/... [MainThread  ] [INFO ]  Retrieving http:// ... [MainThread  ] [WARNI]  Failed to see startup log message; retrying...
...
2019-04-08 14:53:05,910 [MainThread  ] [ERROR]  Tika startup log message not received after 3 tries.
2019-04-08 14:53:05,916 [MainThread  ] [ERROR]  Failed to receive startup confirmation from startServer.

我的问题与这里的 Use tika with python, runtimeerror: unable to start tika server非常相似。但是,最佳答案对我不起作用。我已经安装了 Java 8,但它仍然无法正常工作。我应该怎么办?

4

1 回答 1

2

不确定您对此是否仍有问题 - 或其他任何人来这里。即使您安装了 Java 8(来自 Oracle 左右),终端仍然会看到 OSX 附带的旧 Java。

您需要告诉终端使用刚刚安装的新 Java。把它放到你的 .bash_profile

export JAVA_HOME="/Library/Internet Plug-Ins/JavaAppletPlugin.plugin/Contents/Home/"

否则,检查系统偏好 > Java > Java > 查看 > 路径

您可以看到 Java 的路径,将所有内容复制到 Home/ 并将其粘贴到 export JAVA_HOME=""

重新启动您的终端,tike 现在应该可以工作了

于 2019-07-31T07:16:52.100 回答