我正在尝试修改我的 lucene 应用程序,以便从 HTML 文件中进行全文搜索,但我也想获得最近的锚点。
例如,如果我有这个 HTML 代码:
.......
<a name="1"></a>
<p style="font-size:12pt;text-align: justify;text-indent:30px;">
closest anchor i would like to find.
</p>
.......
<a name="2"></a>
<p style="font-size:12pt;text-align: justify;text-indent:30px;">
testing full text search.
</p>
.......
如果我搜索字符串“全文搜索”,我想获得名称为 2 的锚点,以便在 html 中定位。
我听说这可以通过 Solr 实现。目前我没有使用它,因为我使用 Hibernate Search 作为 Lucene 的核心库。
那么,有什么想法吗?
感谢您的时间!