1

我正在使用训练 GraphSage 算法来提取图形嵌入。我正在研究一个由 (82,339,589) 个节点和 (219,521,164) 个边组成的大图。当我使用 ":queries" 命令检查时,查询被列为正在运行。算法开始于 6 天前。当我用“docker logs xxx”查看日志时,最后的日志列为

2021-12-01 12:03:16.267+0000 INFO 关系存储扫描 (RelationshipScanCursorBasedScanner):从 16247 MiB(17,036,668,320 字节)导入了 352,492,468 条记录和 0 个属性;耗时 59.057 秒、5,968,663.57 关系/秒、275 MiB/秒(288,477,487 字节/秒)(每个线程:1,492,165.89 关系/秒、68 MiB/秒(72,119,371 字节/秒))

2021-12-01 12:03:16.269+0000 信息 [neo4j.BoltWorker-3 [bolt] [/10.0.0.6:56143] ] 正在加载

INFO [neo4j.BoltWorker-3 [bolt] [/10.0.0.6:56143] ] LOADING 加载图的实际内存使用量:8602 MiB

信息 [neo4j.BoltWorker-3 [bolt] [/10.0.0.6:64076] ] GraphSageTrain :: 开始

有一种方法可以查看有关训练过程的详细日志。共享大小的图表需要 6 天时间是否正常?

4

1 回答 1

1

与 FastRP 或 Node2Vec 相比,GraphSAGE 需要很长时间是正常的。从 GDS 1.7 开始,您可以使用

CALL gds.beta.listProgress(jobId: String)
YIELD
  jobId,
  taskName,
  progress,
  progressBar,
  status,
  timeStarted,
  elapsedTime

如果您在没有传入 jobId 的情况下调用,它将返回所有正在运行的作业的列表。如果您使用 jobId 调用,它将为您提供有关正在运行的作业的详细信息。

此查询将汇总 job 的详细信息03d90ed8-feba-4959-8cd2-cbd691d1da6c

CALL gds.beta.listProgress("03d90ed8-feba-4959-8cd2-cbd691d1da6c") 
YIELD taskName, status 
RETURN taskName, status, count(*)

这是进度记录的文档。系统监控程序也可能对您有所帮助。

于 2021-12-07T17:43:26.283 回答