websocket - 海王星 | 小鬼蟒 | 使用 websocket 的并行查询

翻译自：https://stackoverflow.com/questions/61510372 2020-04-29T19:44:38.053

295 次

从 gremlin python jupyter notebook 到 Neptune 集群执行并行查询的最佳方法是什么？我正在尝试使用 Python 中的 Multiprocess 包来解决这个问题。然而，我的三个 db.r5.4xlarge 阅读器很快就会在 100% CPU 时达到最大值，如下图所示。图 1 是 CPU 利用率，图 2 是 gremlin 错误。下面是我的代码。有没有办法使用 websockets 更好地解决这个问题？如果是的话，你能帮我解决这个问题，因为我对小精灵或海王星很陌生。

params = [tuple(x) for x in new_registrations_list[['id','createddate']].values]
pool = Pool(42)
df=pool.starmap(process_vertex,params)
pool.close()


def process_vertex(vertex_id, reg_date):    
    g=neptune.graphTraversal(neptune_endpoint='neptune-endpoint', neptune_port=xxx1x)
    vertices=g.V(str(vertex_id)).repeat(__.both().dedup()).emit().project('id').by(T.id).toList()

websocket - 海王星 | 小鬼蟒 | 使用 websocket 的并行查询

0 回答 0

Related

Reference