我一直在尝试让 Apache-Tika 使用这个 python 包:https ://github.com/chrismatmann/tika-python
我的 python 程序中有以下代码:
#!/usr/bin/env python
import tika
tika.initVM()
from tika import parser
parsed = parser.from_file('pdf/myPdf.pdf')
但我每次都会收到 422 响应:
[MainThread ] [WARNI] Failed to see startup log message; retrying...
[MainThread ] [WARNI] Tika server returned status: 422
当我使用以下命令时,Apache Tika 确实有效:
java -jar tika-app-1.18.jar -t pdf/alnaggar2016lattice.pdf
我真的很想用 Tika-Python 包来修复这个错误,因为如果这可行的话,项目的其余部分会容易得多。