1

我完全迷路了。我想我肯定在这里遗漏了一些基本的东西。每个人都对 Solr 有这么棒的评价,但我没看到。

我在 Solr 中索引了一个结构化的 pdf 文档。问题是当我搜索一个简单的字符串时 - 我将整个内容字段作为响应!我不知道如何改变它。我的要求是,假设我搜索它应该给我的“元数据”

" MetadataDiscussion . . . 4 个匹配项...确保 Tika 用户有机会获得 Tika 创建和/或提取的所有元数据。== 原始问题 == 此页面的原始灵感是 Tika .. . 10.7k - rev: 2 (current) last modified: 2010-08-02 18:09:45 "

但它给了我整个文档!- 被索引的整个字符串。似乎 Lucene 只能告诉我它发生在哪个领域,而不是它发生在哪个领域

任何帮助将不胜感激!!

4

1 回答 1

0

Lucene/Solr 主要是一个检索引擎——它检索与查询匹配的文档。所以这种行为是可取的和预期的。现在,对于您的要求,您可以使用Solr的突出显示功能来满足您的要求。假设您的文档文本存储在名为text- 的字段中,那么您将向 Solr 传递以下参数:

&hl=true&hl.fl=text&hl.snippets=5&hl.fragsize=200

查看其他参数以进一步自定义它。

Solr惊人的 :)

于 2012-05-19T02:08:45.317 回答