1

我想在使用 Apache Solr 索引数据时使用 NLP。

  1. 识别单词的同义词并索引。

  2. 识别命名实体并在索引时对其进行标记。

  3. 当有人查询 Solr 索引时,我应该能够从查询中提取命名实体和意图并形成查询字符串,以便它可以有效地搜索索引文件。

是否有任何工具/插件可以满足我的要求?我相信这是大多数基于内容的网站的常见用例。人家是怎么处理的?

4

2 回答 2

4

这是一个使用斯坦福 NER 和 SOLR 的教程

于 2013-08-13T23:40:33.957 回答
2

查看Apache UIMA

具体来说,如果您需要 Solr 进行命名实体识别,您可以使用SolrUIMA将其与 UIMA 集成

看看这个演示 UIMA + Solr 的演讲

于 2013-08-06T05:34:04.200 回答