0

我有一个非常简单的 Neo4j HA 设置,带有一个主实例和一个嵌入式 HA 实例,我想将其用于批量数据加载。这是主实例配置(我“正常”启动的配置,作为 Windows 服务):

node_auto_indexing=true
node_keys_indexable=key,entity,annotation
relationship_auto_indexing=true
relationship_keys_indexable=key, weight, label
keep_logical_logs=true
online_backup_enabled=true

ha.server_id=1
ha.initial_hosts=:5001
ha.server=0.0.0.0:6001
ha.cluster_server=:5001
ha.pull_interval=10
ha.tx_push_factor=0
ha.tx_push_strategy=fixed

cypher_parser_version=2.0
remote_shell_enabled=true
remote_shell_port=1377

org.neo4j.server.database.mode=HA

我希望能够按需启动和停止嵌入式。这是我在 Java 应用程序中加载的配置:

node_auto_indexing=true
node_keys_indexable=key,annotation
relationship_auto_indexing=true
relationship_keys_indexable=key, weight, label
keep_logical_logs=true

org.neo4j.server.database.mode=HA
ha.server_id=2
ha.slave_only=true

ha.initial_hosts=:5001
ha.server=:6002
ha.cluster_server=:5002

ha.pull_interval=10
cypher_parser_version=2.0

这个想法是能够将第一个(Windows 服务)实例作为单个/独立节点启动,并在需要时启动批处理加载程序。

问题

我可以成功启动 Windows 服务并像往常一样触发查询。当我启动我的应用程序时,它连接得很好并扮演从节点的角色。我可以毫无问题地加载我的数据,并且主节点似乎是同步的,工作正常。现在,如果 Java 应用程序因任何原因崩溃或完成并关闭,主实例将停止工作,并且对于任何 Cypher 查询都会返回以下跟踪:

TransactionFailureException
Timeout waiting for cluster to elect master
StackTrace:
org.neo4j.kernel.ha.HighlyAvailableGraphDatabase.beginTx(HighlyAvailableGraphDatabase.java:207)
org.neo4j.kernel.TransactionBuilderImpl.begin(TransactionBuilderImpl.java:39)
org.neo4j.kernel.InternalAbstractGraphDatabase.beginTx(InternalAbstractGraphDatabase.java:882)
org.neo4j.cypher.ExecutionEngine.prepare(ExecutionEngine.scala:102)
org.neo4j.cypher.ExecutionEngine.execute(ExecutionEngine.scala:70)
org.neo4j.cypher.ExecutionEngine.execute(ExecutionEngine.scala:85)
org.neo4j.cypher.javacompat.ExecutionEngine.execute(ExecutionEngine.java:80)
org.neo4j.server.rest.web.CypherService.cypher(CypherService.java:95)
java.lang.reflect.Method.invoke(Unknown Source)
org.neo4j.server.rest.security.SecurityFilter.doFilter(SecurityFilter.java:112)

我在配置中做错了吗?

顺便说一句:如果我重新启动第二个实例,主实例将恢复为“正常”。

4

1 回答 1

3

这是预期的行为。就集群而言,集群中有两个实例,如果一个实例关闭,则没有仲裁,因此出于安全原因它变得不可用。在您的设置中,解决此问题的方法是在主实例上启动一个单独的仲裁器,以便始终有 3 个实例中的 2 个可用,因此集群被视为已启动。

于 2013-05-28T03:25:44.850 回答