4

我正在尝试根据数据构建预先输入搜索。

    ID 数据串
    id_1 "这是第一行"
    id_2 "这是第二行"

在查询这些数据时,我会给出如下字符串:

    “第一行”-> 输出:id_1(匹配字符串的 ID)
    “两行”-> 输出:id_2
    "this is line num" --> output id_1 id_2 (多个结果)

对于数据字符串中的每个标记,我尝试使用倒排索引和 n-gram(前缀)。但是对于大型数据集索引 n-gram 很慢(查询在某种程度上已经足够好了)。现在我在谷歌上搜索到 lucene 有 Suggester 类,这些类在预输入搜索中非常快,并使用 FST(有限状态传感器)来实现快速前缀搜索。

如何在我的场景中使用 FST 来更快地进行预先输入搜索?

4

0 回答 0