我在谷歌云数据实验室上运行一个笔记本。它生成一些中间输出文件。运行笔记本时会显示这些文件。
然而,几个小时后,当我再次打开笔记本时,只有 datalab git 存储库中的文件(主要是笔记本文件)在那里,其他所有内容都被删除。笔记本内核似乎也重新启动了。
有什么理由吗?我怎样才能避免这种情况?
我在谷歌云数据实验室上运行一个笔记本。它生成一些中间输出文件。运行笔记本时会显示这些文件。
然而,几个小时后,当我再次打开笔记本时,只有 datalab git 存储库中的文件(主要是笔记本文件)在那里,其他所有内容都被删除。笔记本内核似乎也重新启动了。
有什么理由吗?我怎样才能避免这种情况?
Google Cloud Datalab 在 App Engine 托管 VM 环境中运行。这些使用临时磁盘,不会在重新启动之间保留您的数据。
如果需要保留中间输出文件以供将来使用或合规性原因,则应使用Google Cloud Storage或其他持久机制对它们进行持久化。
VM 实例内的存储仅适用于临时的一次性数据。
一个相关的问题探讨了 Persistant Disks 的使用:Using persistent disks with google Datalab