1

我想为复合词实现 solr 拼写检查器。例如

考虑“苹果香蕉芒果”、“苹果芒果香蕉”、“芒果苹果香蕉”、“芒果香蕉苹果”、“香蕉苹果芒果”、“香蕉芒果苹果”

都是有效的复合词。现在我希望当有人拼错“appule mungobanana”时,solr 拼写检查器应该能够将拼写建议为“apple mangobanana”。

我已经实现(功能正确)这个东西,但我所做的是为每个这样的组合创建一个拼写检查索引。所以拼写检查索引变得巨大。如果我创建这样一个索引,我估计拼写检查索引的大小将变为 1GB 左右。

现在我只想索引复合词“apple mangobanana”的一种组合

并期望 solr 为所有组合返回正确的拼写。

是否可以不索引所有可能的组合?

4

1 回答 1

2

这可以通过spellcheck.collat​​e来完成。如果您使用 Dismax,您可能希望将 mm 设置为 100%,以便您仅获得文档中实际存在的建议组合。

于 2013-10-03T08:30:26.427 回答