建议搜索更快

翻译自：https://stackoverflow.com/questions/38190893 2016-07-04T19:04:36.047

572 次

我正在尝试根据数据构建预先输入搜索。

    ID 数据串
    id_1 "这是第一行"
    id_2 "这是第二行"

在查询这些数据时，我会给出如下字符串：

    “第一行”-> 输出：id_1（匹配字符串的 ID）
    “两行”-> 输出：id_2
    "this is line num" --> output id_1 id_2 (多个结果)

对于数据字符串中的每个标记，我尝试使用倒排索引和 n-gram（前缀）。但是对于大型数据集索引 n-gram 很慢（查询在某种程度上已经足够好了）。现在我在谷歌上搜索到 lucene 有 Suggester 类，这些类在预输入搜索中非常快，并使用 FST（有限状态传感器）来实现快速前缀搜索。

如何在我的场景中使用 FST 来更快地进行预先输入搜索？

0 回答 0