0

我很难理解 Elasticsearch 中标记器和分析器的可能性。

假设有一组产品的索引数据。每个产品都有一个带有描述文本的字段。在描述中,一种颜色被命名。

是否可以使用内置分析器或自定义标记器/分析器来提取该颜色信息(例如,基于一组关键字 [红色、绿色、蓝色、黄色等])并将该新颜色信息附加为产品的单独字段?

使用通用属性(例如颜色、材料等)增强传入数据将是一个不错的功能

4

1 回答 1

0

您描述的过程更多地与实体识别有关。有不同的库可以提供文本:OpenNLPUIMA等等。

您可能想看看elasticsearch OpenNLP 插件,它完全符合您的要求:检测实体并将相应的字段添加到传入文档中。

于 2013-03-15T09:40:34.997 回答