0

我是 Lucene 的新手,没有足够的时间浏览整个文档。我们正在使用 Lucene 荧光笔来突出显示匹配项。据我所知,Lucene 本身正在使用 JFlex 引擎。当前任务需要引入新的语言支持。根据要求,像 ειναι 这样的词应该匹配 είναι,反之亦然。人们在输入消息时通常会避免使用重音,因此带有重音的单词必须与没有重音的相同单词匹配。所以,我的问题是我们是否可以在 Lucene 或 JFlex 字符转换规则中指定某处,如 U+038A->U+03B9 ?任何帮助将不胜感激。

4

1 回答 1

0

不确定角色转换......但你可以做几件事:

从我使用的情况来看,这不是一个简单的配置设置。Solr 可能有类似的东西。Lucene 是一个裸库,通常可以让您灵活地确定“业务逻辑所在”的位置……在搜索、分析器/过滤器或索引设计本身中。

于 2012-11-26T16:41:19.180 回答