我正在寻找一种解决方案来扩展我当前的 Apache Solr (4.x),以便它可以用于支持大量语言。我想采用多核方法,并设置了我的 solr,使其具有英语核心和日语核心(对于初学者)。为了挑战,我得到了 n 个 .xml 文件,其中包含 solr 将用于索引的数据。所以要清楚:
我有 n 种语言,并且有 n 个 .xml 文件(每种语言一个 .xml)。每个 .xml 文件在标记方面都是相同的,只有原始文本不同。
我的问题是,我似乎无法弄清楚如何将english.xml 文件严格发布到英语核心,而将japan.xml 文件严格发布到日语核心,所以当我访问我的页面时:
www.example.com/ us /index.html,我正在查看english.xml 索引结果,并且
www.example.com/ jp /index.html 为我提供了 Japanese.xml 索引结果。
实际上只需要一个模式,因为不同语言的 .xml 文件的结构相同,但我复制了所有这些文件,因为每个模式文件都将针对其各自的语言进行优化。
如果(TLDR){
How would I independently post:
english.xml -> core-english
japanese.xml -> core-japanese
Or what would be a better approach that gives me
facet and search independent groups so that I can localize my pages?
}
显然我不想运行 n 个不同的 solr 实例。