0

我有大文本文件。比如说,如果我搜索“计算机 m”,那么我想得到“计算机显示器”、“计算机内存”和“计算机市场份额”。我怎样才能只获得匹配的短语?

我应该使用 ShingleAnalyzerWrapper 索引文件吗?我应该为此目的使用 SpellChecker 吗?

我怎样才能做到这一点?

4

2 回答 2

0

org.apache.lucene.search.highlight.Highlighter用于从找到的文档中提取最匹配的文本。就像 Google 如何在搜索结果中突出显示(或以粗体显示)匹配文本一样。

此博客条目可能会帮助您开始使用它: http ://hrycan.com/2009/10/25/lucene-highlighter-howto/

于 2012-12-10T17:01:23.760 回答
0

您可以为此使用MultiPhraseQuery

于 2012-12-09T17:16:07.887 回答