假设我有 5 个文档,其字段文本如下:
- 红房子很漂亮
- 房子很小
- 红鱼
- 红黄相间的房子很大
如果我搜索“红房子”,我应该使用什么样的查询来检索文档,使得排名如下:
- 红房子又漂亮又大【搭配:红房子】
- 红黄房子大【搭配:红xx房子】
- 房子很小[匹配:房子]
- 红鱼【搭配:红色】
我需要的是对与我搜索过的短语匹配的文档给予较高的排名,而对仅搜索了部分短语的文档给予较低的分数。请注意,字符串查询也可能包含超过 2 个术语。
它就像一个 PhraseQuery,其中每个术语可以出现或不出现,并且术语越接近得分越高。
我尝试使用 TermQuery 组合 PhraseQuery,但结果不是我需要的。
我能怎么做?
谢谢