0

我是使用 Neo4j 的新手,并在 Neo4j 中设置了一个测试图数据库,用于组织一些点击流数据,其中只有我们日常实际使用的一小部分数据。该图有大约 2300 万个节点和 3400 万个关系。查询似乎需要永远运行,即即使等待超过 30 分钟,我也没有看到响应回来。

数据组织为年->月->日->会话{1..n}->事件{1..n}

我在 Windows 7 机器上运行数据库,1.5 GB 堆分配给 Neo4j 服务器

这些是 neo4j-wrapper.conf 中的配置

wrapper.java.additional.1=-Dorg.neo4j.server.properties=conf/neo4j-server.properties
wrapper.java.additional.2=-Djava.util.logging.config.file=conf/logging.properties
wrapper.java.additional.3=-Dlog4j.configuration=file:conf/log4j.properties

wrapper.java.additional.6=-XX:+UseParNewGC

wrapper.java.additional.7=-XX:+UseConcMarkSweepGC

wrapper.java.additional.8=-Xloggc:data/log/neo4j-gc.log

wrapper.java.initmemory=1500

wrapper.java.maxmemory=1500

这就是我的查询的样子

START n=node(3)
MATCH (n)-[:HAS]->(s)
WITH distinct s
MATCH (s)-[:HAS]->(e) WHERE e.page_name = 'Login'
WITH s.session_id as session, e
MATCH (e)-[:FOLLOWEDBY*0..1]->(e1) 
WITH count(session) as session_cnt, e.page_name as startPage, e1.page_name as nextPage
RETURN startPage, nextPage, session_cnt

我也设置了这些属性

node_auto_indexing=true
node_keys_indexable=name,page_name,geo_country
relationship_auto_indexing=true

谁能帮我弄清楚可能出了什么问题。

即使我运行部分查询,也需要 10-15 分钟才能看到响应。

注意:我没有在 Windows 机器上运行其他应用程序

4

0 回答 0