2

将文件(例如存储为数千个文本文件的数据)从我的本地计算机获取到我可以轻松地将它们加载到 Jupyter 笔记本的地方的最佳方法是什么?我已经gcloud在本地计算机上安装了这些工具并按照说明进行操作,但ssh一直超时。如果我去开发控制台,说我需要以这种方式从“谷歌管理”到“自我管理”实例更改为 SSH。是否datalab需要由 Google 管理?

4

2 回答 2

1

我建议将这些文件放入 Cloud Storage,然后使用 gsutil 命令将整个文件集复制到存储桶中。

完成此操作后,请查看存储笔记本以获取处理存储中文件的示例 - 枚举、读/写、删除等。

希望这能让你开始。

于 2015-10-29T00:12:22.317 回答
0

您也可以将数据流式传输到 BigQuery 表中,甚至可以使用 Table.insert_data 在您的笔记本中执行此操作,尽管如果有大量数据,这可能并不理想。这取决于你想对数据做什么。如果它纯粹是为了 BQ 使用,那么将它放在 BQ 表中是有意义的。如果您需要从其他 Google 产品访问它或轻松上传/下载它,那么 GCS 更合适。

于 2015-11-16T23:48:32.117 回答