8

我让 Solr 运行多个内核。由于负载很重,我想设置一个包含完全相同索引的从站。

文档http://wiki.apache.org/solr/SolrReplication声明“将复制请求处理程序添加到每个核心的 solrconfig.xml”,但我只有一个 solrconfig.xml。

我的配置:
配置:/data/solr/web/solr/conf/config 文件
数据:/data/solr/data/solr/core 数据目录

真的有必要为每个核心复制 solrconfig.xml 吗?
我应该把这些多个 solrconfig 文件放在哪里?

solr.xml

<?xml version="1.0" encoding="UTF-8" ?>
  <solr persistent="true">
  <property name="dih.username" value="user"/>
  <property name="dih.password" value="passwd"/>
  <property name="jdbclib" value="/usr/progress/dlc102b/java"/>
  <property name="dih.dburl" value="jdbc:datadirect:openedge://172.20.7.218:31380;databaseName=easource"/> <cores adminPath="/admin/cores">
    <core instanceDir="/data/solr/web/trunk/" name="product" dataDir="/data/solr/data/trunk/product-swap">
      <property name="dih-config" value="dih-config-product.xml"/>
    </core>
    <core instanceDir="/data/solr/web/trunk/" name="product-swap" dataDir="/data/solr/data/trunk/product">
      <property name="dih-config" value="dih-config-product.xml"/>
    </core>
    <core instanceDir="/data/solr/web/trunk/" name="periodp" dataDir="/data/solr/data/trunk/periodp">
      <property name="dih.config" value="dih-config-periodp.xml"/>
    </core>
    <core instanceDir="/data/solr/web/trunk/" name="periodp-swap" dataDir="/data/solr/data/trunk/periodp-swap">
      <property name="dih.config" value="dih-config-periodp.xml"/>
    </core>
  </cores>
</solr>
4

2 回答 2

16

您需要做的是复制您在从属服务器上的 solr 实例,并在solrconfig.xml. 最佳做法是instanceDir为每个核心设置不同的目录,因为通常每个核心都有自己的schema.xmlsolrconfig.xml. 无论如何,您可以使用相同的 conf,只需将您配置solr.xml为指向相同instanceDir但不同dataDir的 ,您也可以像dataDir在您的配置中solrconfig.xml一样:

<solr persistent="true" sharedLib="lib">
    <cores adminPath="/admin/cores">
        <core name="core0" instanceDir="core">
            <property name="dataDir" value="/data/core0" />
        </core>
        <core name="core1" instanceDir="core">
            <property name="dataDir" value="/data/core1" />
        </core>
    </cores>
</solr>

如果您当前有多个核心但只有一个solrconfig.xml.

slaves上的solrconfig.xmlreplication部分需要包含master的url,包括core name,当然每个core都不一样。但是您可以像这样使用占位符 ${solr.core.name} :

<requestHandler name="/replication" class="solr.ReplicationHandler" >
    <lst name="slave">
        <str name="masterUrl">http://master_host:port/solr/${solr.core.name}/replication</str>
        <str name="pollInterval">00:00:20</str>
    </lst>
</requestHandler>

事实上,像这样的一些属性solr.core.name会自动添加到核心作用域中,您可以在配置中引用它们。因此,如果您没有任何特定于核心的设置,则每个核心的复制部分都可以相同。

此外,您可以对具有以下配置的主从enable.master配置使用相同的配置,并enable.slave根据您想要执行的操作更改您分配给环境变量的值(true 或 false) 。我的意思是你可以使用同一个文件,但当然它会在不同的机器上,因为在同一台机器上拥有 master 和 slave 没有多大意义。

<requestHandler name="/replication" class="solr.ReplicationHandler" >
    <lst name="master">
        <str name="enable">${enable.master:false}</str>
        <str name="replicateAfter">commit</str>
    </lst>
    <lst name="slave">
        <str name="enable">${enable.slave:false}</str>
        <str name="masterUrl">http://master_host:8983/solr/${solr.core.name}/replication</str>
        <str name="pollInterval">00:00:60</str>
    </lst>
</requestHandler>
于 2012-10-25T09:48:41.597 回答
1

是的,您需要在要复制的每个核心副本中拥有完全相同的文件副本。

要卸载更多的 solr 实例,我建议您有一个仅用于索引的主服务器和 2 个从主服务器复制的从服务器,用于查询您的文档。

于 2012-10-25T09:37:46.920 回答