2

我们将 IBM WCS v7 用于我们基于电子商务的需求之一,其中嵌入了 Apache solr 用于基于搜索的实现。

根据一项新要求,一个网站将支持多种语言,前法国版本的网站可以支持英语、法语等(en_FR、fr_FR 等)为了使用此界面配置 solr,应该是使用单个 solr 核心的最佳索引策略吗?

我得到了一些想法 1)在 schema.xml 中为多种语言使用多个字段,2)为不同的语言使用不同的 solr 核心。

但这些方法似乎不是最适合当前要求的方法,因为电子商务网站将支持 18 种语言。为每种语言使用不同的字段将非常复杂,而且使用不同的 solr 代码也不是一个好方法,因为我们需要在所有 solr 核心中应用配置更改,如果它根据任何要求发生的话。

有没有其他方法,或者有什么方法可以将 localeId 与索引数据相关联并根据检测到的语言处理搜索结果?

对此主题的任何帮助将不胜感激。

谢谢并恭祝安康,

Jitendriya Dash

4

1 回答 1

1

这篇文章已经被原始发帖人和其他人回答了——只是把它总结为一个答案:

推荐的解决方案是为每种语言环境/语言创建一个索引核心。如果目录或内容(例如产品名称、描述、关键字)不同并且企业更愿意为每个区域单独管理它,这一点尤其重要。这为 Solr 执行特定于该语言环境的词干和标记化(如果适用)提供了额外的好处。

我参与了一些解决方案,在这些解决方案中,这种方法优于在同一核心中为每种语言环境/语言维护多个字段或文档。我使用过的大多数索引核心是 6 个。

还必须记住,添加索引核心将需要更新支持流程(产品信息管理系统更新到目录加载到工作区管理到阶段传播到重新索引到缓存失效)。

于 2014-08-12T05:58:27.373 回答