solr - Solr：索引 fb2 文件

Question

我想使用 Solr 来索引一些图书馆，这些图书馆代表 fb2 格式的书籍。实际上 fb2 只是具有类似xsd 格式的 xml 。但是，post.jar 忽略 *.fb2 文件，我不明白如何将 fb2 文件中的值映射到索引字段，例如：

<book-title>some book</book-title>

...到索引中的“书名”字段。我应该创建一个插件还是其他？

score 3 · Accepted Answer

您应该查看 Solr 数据导入处理程序 (DIH)。

在 Solr 示例文件夹中，您有一个 RSS 导入示例。如果您查看 rss-data-config.xml 文件，您将看到他们如何使用 XPathEntityProcessor 从 XML 映射到 Solr 字段，例如：

我过去也编写过 Tika 解析器来处理特定的文件格式。

为了获得更大的灵活性，您可以使用自己喜欢的编程语言读取文件并使用 API 将数据发送到 Solr。我们必须为最近的应用程序这样做，因为 DIH 不够灵活，无法实现我们想要实现的目标。

1 回答 1