我正在尝试使多语言词干与 Solr 一起工作。我已经LangDetectLanguageIdentifierUpdateProcessorFactory
按照官方 Solr 指南设置了语言检测。该语言已被识别,现在我有一大堆动态字段,例如:
- 描述_zh
- 描述_de
- description_fr
- ...
哪些是适当的词干。
现在的问题是如何在这么多领域进行搜索?每次进行长查询以搜索数十种可能的语言字段似乎不是一个明智的选择。我试过使用copyField
像:
<copyField source="description_*" dest="text"/>
text
但是当我这样做时,词干正在消失。
该text
字段定义solr.TextField
为solr.WhitespaceTokenizerFactory
。也许我没有text
正确设置字段或者应该如何完成?