我想弄清楚 lucene 的分析器是如何工作的?我的问题是 lucene 如何处理同义词?情况如下:我们有单个词和多个词
单:foo = bar 多词:foo bar = foobar
对于单个单词:
- lucene 是否扩展索引记录?我猜如果一个查询有一个像“foo”这样的词,它也会在查询中添加“bar”。我不知道它是否发生在索引上?
对于多字:
- lucene 是否同时扩展查询和索引?例如,如果我们有“foo bar”,它是否将 foobar 添加到索引/查询中?
我的第二个问题是:Lucene 使用令牌流并将它们提供给小写过滤器等过滤器。我的问题是 lucene 如何找到多个单词?就像它是如何发现“foo bar”是一个多词在一起的?
谢谢