1

假设我在 Solr(最新)中抓取并索引了以下一组分组网站:

{
    "id":"1",
    "domain": "http://www.category1website1.com",
    "domainGroup": "Group 1"
},{
    "id":"2",
    "domain": "http://www.category1website2.com",
    "domainGroup": "Group 1"
},{
    "id":"3",
    "domain": "http://www.category2website1.com",
    "domainGroup": "Group 2"
}

我正在寻找一个结果集,它将为我提供每个单独域中的词频,以及该搜索词的聚合词频(按 domainGroup 聚合)

对此进行研究使我想到了 3 种可能性:

  1. 可以用 Facet Pivot 完成
  2. 可以用 Facet + 词频向量来完成
  3. 无法完成

1 和 2 是不同的,我不确定哪个对我有用,或者更糟糕的是,通过“选项”3 也不能。

抱歉,如果不清楚。我正在尝试检索“搜索词”的频率,但我还需要 domainGroup 字段聚合的频率。换句话说,我需要在一个请求中搜索“搜索词”的所有域,并不仅在单个域(默认)中检索“搜索词”的频率,还包括所有域组的聚合频率(因此总和同一域组下所有域中的词频)。

4

1 回答 1

0

我认为带有词频向量的 Facets 是您所需要的。尝试这样的查询:

http://something/solr/select/?qt=tvrh&q=query:http://www.category2website1.com&tv.fl=query&tv.all=true&f.id.tv.tf=true&facet.field=domainGroup&facet=true&facet.limit=-1&facet.mincount=1
于 2013-08-05T14:39:30.033 回答