我有大文本文件。比如说,如果我搜索“计算机 m”,那么我想得到“计算机显示器”、“计算机内存”和“计算机市场份额”。我怎样才能只获得匹配的短语?
我应该使用 ShingleAnalyzerWrapper 索引文件吗?我应该为此目的使用 SpellChecker 吗?
我怎样才能做到这一点?
我有大文本文件。比如说,如果我搜索“计算机 m”,那么我想得到“计算机显示器”、“计算机内存”和“计算机市场份额”。我怎样才能只获得匹配的短语?
我应该使用 ShingleAnalyzerWrapper 索引文件吗?我应该为此目的使用 SpellChecker 吗?
我怎样才能做到这一点?
org.apache.lucene.search.highlight.Highlighter用于从找到的文档中提取最匹配的文本。就像 Google 如何在搜索结果中突出显示(或以粗体显示)匹配文本一样。
此博客条目可能会帮助您开始使用它: http ://hrycan.com/2009/10/25/lucene-highlighter-howto/
您可以为此使用MultiPhraseQuery。