如何删除给定字符串“这是化学方向”的Lucene中的停用词
问问题
800 次
2 回答
0
我认为 Lucene 的StopFilter是您正在寻找的。
于 2012-09-27T09:43:07.623 回答
0
你应该使用 standardAnalyser ,它知道某些标记类型、小写、删除停用词,......使用标准分析器创建 IndexWriter 的示例:
public IndexWriter Indexer(String dir) throws IOException {
IndexWriter writer;
Directory indexDir = FSDirectory.open(new File(dir).toPath());
Analyzer analyzer = new StandardAnalyzer();
IndexWriterConfig cfg = new IndexWriterConfig(analyzer);
cfg.setOpenMode(OpenMode.CREATE);
writer = new IndexWriter(indexDir, cfg);
return writer;
}
于 2015-12-12T13:15:47.247 回答