0

我有这个项目,我们正在实施 Examine / Lucene.net。我正在寻求你们的一些指导。

据我通过google的知识了解到,是不是我想增重,就需要在Field上增重,对吧?

但是我能得到这样的东西吗:如果术语在 h1-tag 或标题中,它是否能够提升术语。当给出一个完整的site-html,并做一个频繁的词条搜索。

我想做的事情是不提供获取 html 文档的服务,并从中可以找到此文档中优化后的单词,具体取决于文本中使用的术语以及它们是否重要位置,例如在标题标签或 h2 标签中等等。

这有可能实现吗?这样编辑们就可以知道,“他们正在写的东西最好用哪个搜索词找到。

提前非常感谢。

4

1 回答 1

1

我不认为它完全那样工作。是的,您可以提升一个字段,但您不能提升一个取决于它在某些标记中的位置的术语,因为您在搜索时不知道这一点。

我认为您可以做的是创建一个在发布页面时触发的 Umbraco 事件处理程序。本次活动可以:

  1. 利用GatheringNodeData索引的事件
  2. 获取基于富文本编辑器的字段的内容并使用正则表达式或类似 HtmlUtility 的东西根据其标记位置提取特定文本,例如 H1、H2 和 H3 文本。

  3. 对于找到的标题中的每一段文本,将其添加到字符串变量中

  4. 将整个字符串作为新字段添加到 Lucene 索引中,例如“标题”
  5. 您现在可以将“标题”字段单独提升到包含包含 HTML 的字段的字段。
于 2013-07-10T14:48:23.100 回答