我使用的是 Solr 7.6,文档结构如下:
{
"source_ln":"en",
"source_text":"the sky is blue",
"target_ln":"hi",
"target_text":"आसमान नीला है",
},
{
"source_ln":"en",
"source_text":"the sky is also called the celestial sphere",
"target_ln":"hi",
"target_text":"आकाश को आकाशीय क्षेत्र भी कहा जाता है",
}
所有字段都使用 StandardTokenizerFactory 标记器定义。
当我查询“source_text”:“天空”时,
结果集应仅包含第一个文档。
在第二个文档中,字段 "source_text":"the sky is also called the celestial sphere" 包含 8 个术语,而查询字段 "source_text":"the sky" 仅包含 2 个术语,因此至少 50% 的匹配条件是未完成,因此第二个文档不会在结果集中。
有没有办法让文档匹配至少 50% 的查询字段术语/标记?
提前致谢。