1

Lunr 在查找大多数结果方面做得很好,但我不明白为什么它不会返回 JSON 数组中包含的多字字符串。

这是一个示例 JSON 文件,可用于了解我的数据的结构:

[{
    "title": "Rolling Loud",
    "date": "May 5–7",
    "location": "Miami, FL, USA",
    "rock-artists": [],
    "hh-artists": ["Kendrick Lamar", "Future"],
    "electronic-artists": [],
    "other-artists": []
}]

当我搜索“迈阿密”和“未来”时,lunr 返回节日。但是,当搜索“Kendrick”或“Kendrick Lamar”时,lunr 不会返回音乐节。

相关代码:

// initialize lunr
var idx = lunr(function () {
    this.field('id');
    this.field('title', { boost: 3 });
    this.field('date');
    this.field('location');
    this.field('rockArtists', { boost: 3 });
    this.field('hhArtists', { boost: 3 });
    this.field('electronicArtists', { boost: 3 });
    this.field('otherArtists', { boost: 3 });

    // add festivals to lunr
    for (var key in data) {
        this.add({
           'id': key,
           'title': data[key].title,
           'date': data[key].date,
           'location': data[key].location,
           'rockArtists': data[key]['rock-artists'],
           'hhArtists': data[key]['hh-artists'],
           'electronicArtists': data[key]['electronic-artists'],
           'otherArtists': data[key]['other-artists']
        });
    }
});

谢谢!

4

1 回答 1

6

Lunr正在索引该hh-artists字段,您应该能够通过查找索引中的值之一来确认这一点:

idx.invertedIndex['Kendrick Lamar']

当一个文档字段是一个数组时,lunr 假定数组的元素已经被分割成用于索引的标记。因此,不是将“Kendrick”和“Lamar”作为单独的标记添加到索引中,而是将“Kendrick Lamar”作为单个标记添加。

这在尝试搜索时会导致问题,因为搜索“Kendrick Lamar”实际上是在搜索“Kendrick”或“Lamar”,因为搜索字符串在空格上拆分以获取标记。“Kendrick”和“Lamar”均不在索引中,因此没有结果。

要获得您希望的结果,您可以将数组转换为字符串并让 lunr 处理将其拆分为标记:

this.add({
  'hhArtists': data[key]['hh-artists'].join(' ')
})
于 2017-04-22T18:15:54.593 回答