我正在尝试在 python 中使用 Tika 来解析 PDF 文件。我正在使用 python 2.7 和 Mac。我无法让它工作。我已经安装了它,然后:
from tika import parser
raw = parser.from_file('...file')
我收到此错误(为简洁而编辑):
Retrieving http://search.maven.org/remotecontent ... to /var/folders/... [MainThread ] [INFO ] Retrieving http:// ... [MainThread ] [WARNI] Failed to see startup log message; retrying...
...
2019-04-08 14:53:05,910 [MainThread ] [ERROR] Tika startup log message not received after 3 tries.
2019-04-08 14:53:05,916 [MainThread ] [ERROR] Failed to receive startup confirmation from startServer.
我的问题与这里的 Use tika with python, runtimeerror: unable to start tika server非常相似。但是,最佳答案对我不起作用。我已经安装了 Java 8,但它仍然无法正常工作。我应该怎么办?