我很难理解 Elasticsearch 中标记器和分析器的可能性。
假设有一组产品的索引数据。每个产品都有一个带有描述文本的字段。在描述中,一种颜色被命名。
是否可以使用内置分析器或自定义标记器/分析器来提取该颜色信息(例如,基于一组关键字 [红色、绿色、蓝色、黄色等])并将该新颜色信息附加为产品的单独字段?
使用通用属性(例如颜色、材料等)增强传入数据将是一个不错的功能
我很难理解 Elasticsearch 中标记器和分析器的可能性。
假设有一组产品的索引数据。每个产品都有一个带有描述文本的字段。在描述中,一种颜色被命名。
是否可以使用内置分析器或自定义标记器/分析器来提取该颜色信息(例如,基于一组关键字 [红色、绿色、蓝色、黄色等])并将该新颜色信息附加为产品的单独字段?
使用通用属性(例如颜色、材料等)增强传入数据将是一个不错的功能
您描述的过程更多地与实体识别有关。有不同的库可以提供文本:OpenNLP、UIMA等等。
您可能想看看elasticsearch OpenNLP 插件,它完全符合您的要求:检测实体并将相应的字段添加到传入文档中。