首先,我必须说我们使用的 Lucene.NET 版本不是最新的,因为它与 Sitecore 6.4.1 打包在一起,直到现在我们还没有深入研究分析器和词干的使用(大错误!)。
基本上,我们正在尝试在索引时间或查询时间实现某种形式的词干提取(寻找最佳的建议?)。我们遇到的主要问题是所有关于 Stemming 的文档都是用 Java 编写的,我真的很难把它带到 C# 中。我希望有人可以提供该领域的源示例或资源链接。
由于我们的 Lucene.NET 版本非常旧,我认为无法使用 Snowball Analyzer(甚至在我们的版本中也不可用),因此我们正在考虑使用 PorterStemFilter。
任何人都可以就如何在无需升级 Lucene 的情况下使 Stemming 工作提供任何帮助/建议吗?
亲切的问候
史蒂夫