我将二进制文档信息(文件元)存储在数据库中,并将二进制文档存储在文件系统中。使用文件名与数据库中的文件信息相关联。
现在我想将所有这些数据(二进制文档中的文件元和全文内容)导入 lucene solr。
lucene/solr 提供“使用数据导入处理程序 (DIH) 从数据库导入记录”。和“使用 Solr Cell (ExtractingRequestHandler) 索引 Word 和 PDF 等二进制文档。”分别导入这些数据。
导入后如何使用 solr/lucene 在二进制文档和文件元之间建立关联
谢谢