我们有一个应用程序可以获取不同语言的文本。我们的目标是理解文本的语言,对每种语言使用不同的词干分析器对其进行分析并对其进行索引。我能够使用Solr 的语言检测机制检测语言。
现在,我想使用每种语言的不同 fieldType 动态分析文本,并将每个文本存储在不同的字段中。
例如,假设我在schema.xml
.
<!-- English -->
<field name="text_en" type="text_en" indexed="true" stored="true"/>
<!-- German -->
<field name="text_de" type="text_de" indexed="true" stored="true"/>
<!-- Turkish -->
<field name="text_tr" type="text_tr" indexed="true" stored="true"/>
当我检测到文本是英文时,我想将其动态添加到text_en
将使用与其他技术不同的技术进行分析/提取的字段中。
Solr 上是否有支持这一点的内置机制?如果是,我该如何配置它?或者我应该为此目的开发插件吗?