我有一个书籍索引,用于存储书籍的全文内容(删除了停用词,但这对我的问题并不重要)。我有以下查询:
> GET /books/_search
> {
> "_source": {
> "includes": ["author", "title"]
> },
> "query": {
> "bool": {
> "should": [
> {
> "match_phrase": {
> "body": "all happy families are alike"
> }
> },
> {
> "match": {
> "body": "all happy families are alike"
> }
> }
> ]
> }
> }
> }
我得到所有具有最高分数的完整字符串的文档的匹配项,然后,分数较低的那些具有一个或多个匹配项:第一个匹配是'Anna Karenina',得分很高,然后是任何有'快乐'的书,'家庭'在里面。我想获得什么:
- 如果文档与条件“match_phrase”匹配,则只得到这个结果(即只得到安娜卡列尼娜,丢弃其余的)
- 否则,列出所有匹配的文档,分数降序(预期行为)
我很难找到如何获得第 1 点。