0

我正在尝试使用 apache tika 和 solr 从文件中设置数据导入。nfs 挂载共享上有共享文档文件夹。不幸的是,我无法执行数据导入,处理了 1 个文件,然后出现异常:

[http-8080-3] ERROR org.apache.solr.handler.dataimport.DocBuilder - Exception while processing: files document : null:org.apache.solr.handler.dataimport.DataImportHandlerException: Unable to read content Processing Document # 2
    at org.apache.solr.handler.dataimport.DataImportHandlerException.wrapAndThrow(DataImportHandlerException.java:71)
....
    at java.lang.Thread.run(Thread.java:744)
Caused by: java.io.IOException: Access denied
    at java.io.UnixFileSystem.createFileExclusively(Native Method)
    at java.io.File.createNewFile(File.java:1006)
    at java.io.File.createTempFile(File.java:1989)
    at org.apache.tika.io.TemporaryResources.createTemporaryFile(TemporaryResources.java:66)
    at org.apache.tika.io.TikaInputStream.getFile(TikaInputStream.java:533)
    at org.apache.tika.io.TikaInputStream.getFileChannel(TikaInputStream.java:564)
    at org.apache.tika.parser.microsoft.POIFSContainerDetector.getTopLevelNames(POIFSContainerDetector.java:373)
    at org.apache.tika.parser.microsoft.POIFSContainerDetector.detect(POIFSContainerDetector.java:165)
    at org.apache.tika.detect.CompositeDetector.detect(CompositeDetector.java:61)
    at org.apache.tika.parser.AutoDetectParser.parse(AutoDetectParser.java:113)
    at org.apache.solr.handler.dataimport.TikaEntityProcessor.nextRow(TikaEntityProcessor.java:140)
    ... 26 more

所以在写临时文件的时候,权限似乎有些问题。不幸的是,我不知道 tike 究竟在哪里尝试写入临时文件,所以我无法检查 nfs 的权限。我检查了 tika 主文件夹(核心配置)和 docs 文件夹和子文件夹的权限 - 一切正常,包括有问题的文档。

我还尝试将核心配置中的 docs 目录更改为其他目录(在同一个 nfs 共享上),一切正常。那么,您知道如何跟踪我的问题吗?

[编辑] 我只是注意到这不是真正的权限问题。一切都适用于文件 .docx 和 .pdf。但是在 .doc 文件上它失败了。你有什么想法?

4

0 回答 0