java - Neo4j HA (2.0-Snapshot)，超时等待集群选举master

Question

我有一个非常简单的 Neo4j HA 设置，带有一个主实例和一个嵌入式 HA 实例，我想将其用于批量数据加载。这是主实例配置（我“正常”启动的配置，作为 Windows 服务）：

node_auto_indexing=true
node_keys_indexable=key,entity,annotation
relationship_auto_indexing=true
relationship_keys_indexable=key, weight, label
keep_logical_logs=true
online_backup_enabled=true

ha.server_id=1
ha.initial_hosts=:5001
ha.server=0.0.0.0:6001
ha.cluster_server=:5001
ha.pull_interval=10
ha.tx_push_factor=0
ha.tx_push_strategy=fixed

cypher_parser_version=2.0
remote_shell_enabled=true
remote_shell_port=1377

org.neo4j.server.database.mode=HA

我希望能够按需启动和停止嵌入式。这是我在 Java 应用程序中加载的配置：

node_auto_indexing=true
node_keys_indexable=key,annotation
relationship_auto_indexing=true
relationship_keys_indexable=key, weight, label
keep_logical_logs=true

org.neo4j.server.database.mode=HA
ha.server_id=2
ha.slave_only=true

ha.initial_hosts=:5001
ha.server=:6002
ha.cluster_server=:5002

ha.pull_interval=10
cypher_parser_version=2.0

这个想法是能够将第一个（Windows 服务）实例作为单个/独立节点启动，并在需要时启动批处理加载程序。

问题

我可以成功启动 Windows 服务并像往常一样触发查询。当我启动我的应用程序时，它连接得很好并扮演从节点的角色。我可以毫无问题地加载我的数据，并且主节点似乎是同步的，工作正常。现在，如果 Java 应用程序因任何原因崩溃或完成并关闭，主实例将停止工作，并且对于任何 Cypher 查询都会返回以下跟踪：

TransactionFailureException
Timeout waiting for cluster to elect master
StackTrace:
org.neo4j.kernel.ha.HighlyAvailableGraphDatabase.beginTx(HighlyAvailableGraphDatabase.java:207)
org.neo4j.kernel.TransactionBuilderImpl.begin(TransactionBuilderImpl.java:39)
org.neo4j.kernel.InternalAbstractGraphDatabase.beginTx(InternalAbstractGraphDatabase.java:882)
org.neo4j.cypher.ExecutionEngine.prepare(ExecutionEngine.scala:102)
org.neo4j.cypher.ExecutionEngine.execute(ExecutionEngine.scala:70)
org.neo4j.cypher.ExecutionEngine.execute(ExecutionEngine.scala:85)
org.neo4j.cypher.javacompat.ExecutionEngine.execute(ExecutionEngine.java:80)
org.neo4j.server.rest.web.CypherService.cypher(CypherService.java:95)
java.lang.reflect.Method.invoke(Unknown Source)
org.neo4j.server.rest.security.SecurityFilter.doFilter(SecurityFilter.java:112)

我在配置中做错了吗？

顺便说一句：如果我重新启动第二个实例，主实例将恢复为“正常”。

score 3 · Accepted Answer

这是预期的行为。就集群而言，集群中有两个实例，如果一个实例关闭，则没有仲裁，因此出于安全原因它变得不可用。在您的设置中，解决此问题的方法是在主实例上启动一个单独的仲裁器，以便始终有 3 个实例中的 2 个可用，因此集群被视为已启动。

java - Neo4j HA (2.0-Snapshot)，超时等待集群选举master

1 回答 1

Related

Reference