想要基于 . , ; 等但是希望保留电子邮件地址、IP 地址等。我如何使用带有 lucence 的分析仪来完成这项任务?我在 stackoverflow 上找到的以下代码不保留电子邮件。任何有关如何使用 lucene 的 StandardAnalyzer 的模式规范功能的文档指针也将有所帮助。非常感谢
String text
= "Lucene is simple yet powerful java based search library. sitaraman@dataguise.com";
Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);
TokenStream tokenStream = analyzer.tokenStream(
LuceneConstants.CONTENTS, new StringReader(text));
TermAttribute term = tokenStream.addAttribute(TermAttribute.class);
while(tokenStream.incrementToken()) {
System.out.print("[" + term.term() + "] ");