0

我将我的谷歌驱动器安装在我的 colab 笔记本中,并且我有一个相当大的熊猫数据框并尝试 mydf.to_feather(path) 路径在我的谷歌驱动器中。预计它有 100 兆大,而且需要很长时间。

这是可以预料的吗?似乎 colab 和 google drive 之间的网络链接不是很好。任何人都知道服务器是否在同一地区/地区?

我可能需要更改我的工作流程以避免这种情况。如果您有任何最佳实践或建议,请告诉我,如果没有使用所有 GCP(我希望没有这种延迟)。

4

1 回答 1

1

如果您发现从 google colab 调用 df.to_feather("somewhere on your gdrive") 并且大约为 ~X00mb,您可能会发现零星的性能。保存文件可能需要几分钟到一小时的时间。我无法解释这种行为。

解决方法:首先保存到 colab 主机的本地目录 /content/。然后将文件从 /content 复制到您的 gdrive 挂载目录。这对我来说似乎更加一致和快速。我只是无法解释为什么 .to_feather 直接对 gdrive 造成如此大的影响。

于 2019-06-06T22:10:35.083 回答