如果我们想在倒排索引结构中搜索“t1 t2 t3”(t1,t2,t3 必须排队)这样的查询,我们应该怎么做?
1-首先我们搜索 "t1" 术语并找到包含 "t1" 的所有文档,然后对 "t2" 和 "t3" 执行此工作。然后找到“t1”、“t2”和“t3”位置相邻的文档。
2-首先我们搜索“t1”词并找到所有包含“t1”的文档,然后在我们找到的所有文档中,我们搜索“t2”,接下来,在这个结果中,我们找到包含“t3”的文档” 。
我有一个完整的倒排索引。我想知道上面哪些方式是优化的,(1)还是(2)?
多谢。