1

我正在使用带有 GPU 的 Google Cloud Platform Compute Engine VM 上的 darkflow 进行自定义对象检测训练,但是每当我失去连接或笔记本电脑进入睡眠状态时,长时间运行的进程就会终止。我已经尝试通过我的 Windows 机器上的 SSH、使用 Google Cloud Shell、通过云平台上的 Jupyter Notebook 上的终端以及直接通过云平台上的 Jupyter Notebook 运行它,但是由于连接丢失,该过程在所有这些场景中都失败了即使虚拟机正在运行。保持这个长期运行过程的最佳方式是什么?PS 我后来确实意识到 Google Cloud Shell 不适合这个目的。

4

2 回答 2

1

正如您已经编写的 CloudShell 不适合那种工作,使用 screen、tmux 或 byobu 的工作也无济于事。最佳实践就是使用抢占式虚拟机。

文档中提到了 CloudShell 的一些限制:

使用限制

Cloud Shell 仅供交互式使用。非交互式会话将在出现警告后自动结束不支持长时间使用或计算网络密集型进程,并可能导致会话终止而不发出警告。

Cloud Shell 也有每周使用限制。如果您达到使用限制,则需要等到指定时间(列在使用配额下,在三点菜单图标下找到)才能再次使用 Cloud Shell。

于 2019-06-18T12:09:43.513 回答
0

没关系,我在这里找到了解决方案:https ://askubuntu.com/questions/8653/how-to-keep-processes-running-after-ending-ssh-session

于 2018-09-03T05:09:05.487 回答