0

假设我在 Solr 中有一个名为“OCR_text”的字段。如果给定 <doc> 的 OCR_text 字段包含类似“这是 foo bar,我的 foo bar 为其他人找到 foo bar”之类的字符串,是否可以从 Solr 为每个“实例”提供单独且唯一的响应来自同一 <doc> 的 OCR_text 中的 foo"?

目前,如果我要搜索“OCR_text:foo”,我只会得到一个响应,即使“foo”包含在多次中。我有一种方法可以迭代该单一响应中的“foo”实例并以这种方式创建唯一结果,但是查询的整体“numFound”并不反映在给定 <doc 中找到“foo”的次数>。

我有一种感觉,这要么是构建我不熟悉的 Solr 查询的一种非常简单的方法,要么是一个从根本上更复杂的问题。任何想法将不胜感激。

4

1 回答 1

1

“numFound”部分只显示文档的数量,而不是单个字段或单个文档中的命中总数。要查找总点击量,您需要使用 TermVectorComponnent,此处此处对此进行了简要说明。您还可以挖掘恶意列表以获取更多详细信息和示例实现。

于 2012-12-02T23:49:31.170 回答