我按照以下链接在 AWS EMR 集群上设置 JupyterHub 的教程进行操作:https ://aws.amazon.com/blogs/big-data/running-jupyter-notebook-and-jupyterhub-on-amazon-emr/
我让集群启动并运行,但现在我的问题是如何进行压力/负载测试?(即模拟 100 个用户同时通过笔记本运行)。
在课堂环境中,我有大约 30 个用户 sshed 到我的集群中运行笔记本练习,但是当更多的人开始执行笔记本中的代码块时,速度大大放缓。发生的事情是一些 python 库的导入需要很长时间,一些练习停止工作或只是挂起。Cloudwatch 显示存在网络瓶颈。
基本上我要问的是我怎样才能去调试这样的东西?模拟多个用户进入 EMR 集群、打开 jupyter 笔记本并同时运行代码块的最佳方法是什么?