尝试使用 jnius 运行 tike-app 但遇到问题(macOS Sierra、Java 1.8 JDK、Python 2.7 和 Python 3.6)一切正常(tika.detect 的输出正常)直到parseToString
命令。如果您运行此命令,似乎会弹出一个炫耀的窗口(也使用 java 程序进行了测试,并且可以正常工作)。但是使用 jnius 运行它会停止工作,并且没有输出也没有错误。
import os
os.environ['CLASSPATH'] = "tika-app-1.14.jar"
from jnius import autoclass
from jnius import JavaException
# Import the Java classes
Tika = autoclass('org.apache.tika.Tika')
Metadata = autoclass('org.apache.tika.metadata.Metadata')
File = autoclass('java.io.File')
# Raise an exception and continue if parsing fails
try:
file = File('./source/test.doc')
tika = Tika()
meta = Metadata()
detectText = tika.detect(file)
print(detectText) # Working the output is: application/msword
contentText = tika.parseToString(file) #here it stops no further steps are executed
print(contentText)
except (JavaException,UnicodeDecodeError) as e:
print("ERROR: %s" % (e))