0

我正在尝试使用 Apache Lucene 4.4 索引 PDF 文件

我不断收到以下异常:

Exception in thread "main" java.lang.NoSuchFieldError: TOKENIZED
at com.snowtide.pdf.lucene.LuceneInterface20.addField(SourceFile:18)
at com.snowtide.pdf.lucene.PDFDocumentFactory.buildPDFDocument(SourceFile:174)
at com.snowtide.pdf.lucene.PDFDocumentFactory.buildPDFDocument(SourceFile:84)
at com.apache.lucene.search.EasyLuceneIntegration.addPDFToIndex(EasyLuceneIntegration.java:134)
at com.apache.lucene.search.EasyLuceneIntegration.main(EasyLuceneIntegration.java:62)

我正在使用 PDFTextStream 并在此处遵循他们的示例:在此处 输入链接描述

4

1 回答 1

1

您引用的项目仅支持 Lucene 2.2。我建议您查看,将您的 PDF 转换为可接受的格式,或者您可以只使用(我相信它是 Tika 用于 PDF 的软件包)。

于 2013-07-24T19:26:27.170 回答