0

我正在寻找一种解决方案来扩展我当前的 Apache Solr (4.x),以便它可以用于支持大量语言。我想采用多核方法,并设置了我的 solr,使其具有英语核心和日语核心(对于初学者)。为了挑战,我得到了 n 个 .xml 文件,其中包含 solr 将用于索引的数据。所以要清楚:

我有 n 种语言,并且有 n 个 .xml 文件(每种语言一个 .xml)。每个 .xml 文件在标记方面都是相同的,只有原始文本不同。

我的问题是,我似乎无法弄清楚如何将english.xml 文件严格发布到英语核心,而将japan.xml 文件严格发布到日语核心,所以当我访问我的页面时:

www.example.com/ us /index.html,我正在查看english.xml 索引结果,并且

www.example.com/ jp /index.html 为我提供了 Japanese.xml 索引结果。

实际上只需要一个模式,因为不同语言的 .xml 文件的结构相同,但我复制了所有这些文件,因为每个模式文件都将针对其各自的语言进行优化。

如果(TLDR){

How would I independently post:
english.xml -> core-english
japanese.xml -> core-japanese


Or what would be a better approach that gives me
facet and search independent groups so that I can localize my pages?

}

显然我不想运行 n 个不同的 solr 实例。

4

1 回答 1

1

本杰明,你的方法很完美。多核是一个很好的方法。

假设您的服务器位于IP 10.10.10.10,并且 solr 在端口 8983 下运行,那么您的多核应该如下所示:

10.10.10.10:8983/solr/us

10.10.10.10:8983/solr/jp

10.10.10.10:8983/solr/fr

...等等

要记住几件事:

  • 每个核心都有自己的 conf 文件夹
  • 在每个 conf 文件夹中,您将拥有 solrconfig.xml、schema.xml、synonyms.txt 和其他特定于该国家/地区的配置文件
  • 每个国家/地区的字段定义都不同,在其 schema.xml 中指定
  • 例如:标题字段将是美国的 fieldType text_general 而法国的 text_fr

发布 XML

这是您发布不同国家/地区的各种 XML 文件内容的方式:

我们:

curl http://10.10.10.10:8983/solr/us/update?commit=true -H "Content-Type: text/xml" --data-binary '<add><doc><field name="id">1</field><field name="title">First Item</field></doc><doc><field name="id">2</field><field name="title">Second Item</field></doc></add>'

法国:

curl http://10.10.10.10:8983/solr/fr/update?commit=true -H "Content-Type: text/xml" --data-binary '<add><doc><field name="id">1</field><field name="title">premier article</field></doc><doc><field name="id">2</field><field name="title">deuxième article</field></doc></add>'

J.P:

curl http://10.10.10.10:8983/solr/jp/update?commit=true -H "Content-Type: text/xml" --data-binary '<add><doc><field name="id">1</field><field name="title">最初の項目</field></doc><doc><field name="id">2</field><field name="title">番目の項目&lt;/field></doc></add>'

搜索

您可以通过查询其核心来独立搜索每个国家:

美国的搜索查询:

http://10.10.10.10:8983/solr/us/select?query=john

JP查询:

http://10.10.10.10:8983/solr/jp/select?query=ジョン
于 2013-07-17T23:24:24.270 回答