0

每个人!

我是 Lucene 的新手。

我正在使用 lucene 进行简历过滤器项目。首先,我想从简历中提取一些基本信息,例如生日等。

假设总是有一行说生日:1989/10/19 或类似的东西。我如何使用 Lucene 而不是直接使用正则表达式来提取这种信息。

目前我发现使用 SpanNearQuery 可能会有所帮助。但似乎我无法将 WildcardQuery 添加到 SpanNearQuery 以匹配生日信息。

我完全被卡住了。有什么好的建议吗?非常感谢!

4

1 回答 1

1

从包含一堆文本和日期格式的 Lucene 字段中提取日期并没有灵丹妙药。最好的方法是编写一个自定义分析器,它可以在索引过程中将术语分开并将数字字符识别为日期。

我为 Lucene 写了几个分析器,但是这样的东西并不是很简单……特别是如果你是 Lucene 的新手。

于 2012-10-30T00:17:57.763 回答