0

我正在尝试修改我的 lucene 应用程序,以便从 HTML 文件中进行全文搜索,但我也想获得最近的锚点。

例如,如果我有这个 HTML 代码:

.......
<a name="1"></a>
<p style="font-size:12pt;text-align: justify;text-indent:30px;">
    closest anchor i would like to find.
</p>
.......
<a name="2"></a>
<p style="font-size:12pt;text-align: justify;text-indent:30px;">
    testing full text search.
</p>
.......

如果我搜索字符串“全文搜索”,我想获得名称为 2 的锚点,以便在 html 中定位。

我听说这可以通过 Solr 实现。目前我没有使用它,因为我使用 Hibernate Search 作为 Lucene 的核心库。

那么,有什么想法吗?

感谢您的时间!

4

0 回答 0