Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想在使用 Apache Solr 索引数据时使用 NLP。
识别单词的同义词并索引。
识别命名实体并在索引时对其进行标记。
当有人查询 Solr 索引时,我应该能够从查询中提取命名实体和意图并形成查询字符串,以便它可以有效地搜索索引文件。
是否有任何工具/插件可以满足我的要求?我相信这是大多数基于内容的网站的常见用例。人家是怎么处理的?
这是一个使用斯坦福 NER 和 SOLR 的教程。
查看Apache UIMA
具体来说,如果您需要 Solr 进行命名实体识别,您可以使用SolrUIMA将其与 UIMA 集成
看看这个演示 UIMA + Solr 的演讲。