0

我正在尝试使用 Lucene.NET 进行 SpellChecker 设置,除了类似于以下的情况外,它都可以正常工作:

我在索引中有包含卫星的文本,我使用 Snowball 对其进行分析。

然后我创建一个 SpellChecker 索引并从中获取建议。传入“Satalite”时我收到的建议是“satellit”。

我假设这是因为 Snowball 将 Satellite 限制为 satellit,因此 SpellChecker 将其作为建议返回。

无论如何,我可以将两者一起使用,而不是为非词干词创建一个额外的字段,以便拼写检查器可以检查?

4

2 回答 2

0

正如上面提到的Shashikant:

你是对的,这是由于词干造成的。不幸的是,词干不仅仅意味着搜索和外部搜索,它们可能毫无意义。即使我不知道除了多次存储它之外的任何其他技术。该附加字段可以配置为存储尽可能少的信息以减轻负担。– Shashikant Kore 12 月 2 日 14:08

于 2009-12-29T14:45:51.480 回答
0

您是否考虑过将雪球过滤器生成的单词作为同义词?这是我要去的一个方向......不知道它会如何运作,但似乎是合理的。然后拼写检查器将返回正确的单词,但我仍然可以进行搜索并找到词干变体。

于 2011-02-13T23:35:33.853 回答