0

我们正在考虑使用 Websolr 插件在我们的 Rails 应用程序中搜索资源。

该应用程序包含许多资源模型。大多数资源模型是自包含的,具有一系列属性:作者、标题、一组标签等,但是一些资源模型附有 pdf。我们需要为此 pdf 的内容编制索引,以便将其作为资源的一部分进行搜索。

我应该如何处理这个?

4

1 回答 1

1

这应该让您开始:ExtractingRequestHandler,它将Tika集成到 Solr 中。

于 2013-02-24T15:55:27.527 回答