2

我花了两天时间尝试在 ClickHouse 中设置复制,但无论我尝试什么配置,我最终都会得到相同的行为。

我能够ReplicatedMergeTree在第一个节点上创建一个表并向其中插入数据。然后我在第二个节点上创建一个副本。数据被复制,我可以看到它正在查询第二个节点。但是当我将数据插入第二个节点时,奇怪的行为就开始了。数据未复制到第一个节点,并出现以下错误:

2017.11.14 11:16:43.464565 [ 30 ] <Error> DB::StorageReplicatedMergeTree::queueTask()::<lambda(DB::StorageReplicatedMergeTree::LogEntryPtr&)>: Code: 33, e.displayText() = DB::Exception: Cannot read all data, e.what() = DB::Exception, 

它与GitHub 上的这个问题非常相似。

当我重新启动第一个节点时,它能够加载插入到第二个节点的新数据并且似乎正在工作。但是,插入更多数据会再次带来相同的错误。

我尝试的最新设置:

按照教程,我有一个具有以下配置的三节点 Zookeeper 集群:

tickTime=2000
initLimit=10
syncLimit=5
dataDir=/opt/zoo2/data
clientPort=12181
server.1=10.201.1.4:2888:3888
server.2=0.0.0.0:12888:13888
server.3=10.201.1.4:22888:23888

ClickHouse 的 zookeeper 配置如下所示:

<?xml version="1.0"?>
<yandex>
    <zookeeper>
        <node>
            <host>10.201.1.4</host>
            <port>2181</port>
        </node>
        <node>
            <host>10.201.1.4</host>
            <port>12181</port>
        </node>
        <node>
            <host>10.201.1.4</host>
            <port>22181</port>
        </node>
    </zookeeper>
</yandex>

我创建这样的所有表:

CREATE TABLE t_r (
  id UInt32,
  d Date
) ENGINE = ReplicatedMergeTree('/clickhouse/tables/t_r', '03', d, (d, id), 8192);

所有副本的唯一区别是相应'03'设置的副本 ID。

感谢您的任何建议!

4

2 回答 2

3

其实这个问题是我自己想出来的。感谢@egorlitvinenko,我再次检查了所有配置,我注意到对于所有三个节点我都设置了相同的interserver_http_port. 如果所有节点都在不同的机器上运行,这不会有问题,但在我的测试场景中,它们并排运行在同一个操作系统上。

于 2017-12-04T07:54:46.190 回答
0

ReplicatedMergeTree('/clickhouse/tables/t_r', '03', d, (d, id), 8192);

您应该为每个副本配置 zookeeper 唯一 ID。当前您使用'03',这是不正确的。在教程中,{replica} 表示宏,在每个节点的 clickhouse 配置文件中配置。

见 - https://clickhouse.yandex/docs/en/table_engines/replication.html#replicatedmergetree

ps 如需进一步帮助,请提供所有节点的配置。

于 2017-11-28T22:25:02.227 回答