我正在使用重要术语聚合,它使用以下查询为我提供了 n 重要术语及其 doc_count 和 bg_count:
{
"query" : {
"terms" : {"user_id": ["x"]}
},
"aggregations" : {
"word_cloud" : {
"significant_terms": {
"field" : "transcript.results.alternatives.words.word.keyword",
"size": 200
}
}
},
"size": 0
}
如果我采用重要术语聚合返回的术语并对该术语进行匹配短语查询。然后,我得到的 hits 值与聚合中的 doc_count 不同。
匹配词组查询:
{
"query": {
"bool": {
"must": [
{
"match_phrase": {
"preprocess_data.results.alternatives.transcript": "<term>"
}
},
{
"match_phrase": {
"user_id": "x"
}
}
]
}
},
"from": 0,
"size": 22
}
该字段preprocess_data.results.alternatives.transcript
具有以下映射:
{
"type" : "text",
"fields" : {
"keyword" : {
"type" : "keyword",
"ignore_above" : 256
}
}
}
在进行聚合和匹配短语搜索时,我无法解释文档计数的差异。请帮忙。