1

从 gremlin python jupyter notebook 到 Neptune 集群执行并行查询的最佳方法是什么?我正在尝试使用 Python 中的 Multiprocess 包来解决这个问题。然而,我的三个 db.r5.4xlarge 阅读器很快就会在 100% CPU 时达到最大值,如下图所示。图 1 是 CPU 利用率,图 2 是 gremlin 错误。下面是我的代码。有没有办法使用 websockets 更好地解决这个问题?如果是的话,你能帮我解决这个问题,因为我对小精灵或海王星很陌生。

params = [tuple(x) for x in new_registrations_list[['id','createddate']].values]
pool = Pool(42)
df=pool.starmap(process_vertex,params)
pool.close()


def process_vertex(vertex_id, reg_date):    
    g=neptune.graphTraversal(neptune_endpoint='neptune-endpoint', neptune_port=xxx1x)
    vertices=g.V(str(vertex_id)).repeat(__.both().dedup()).emit().project('id').by(T.id).toList()

在此处输入图像描述

在此处输入图像描述

4

0 回答 0