问题标签 [google-cloud-datalab]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
1498 浏览

google-cloud-platform - 如果 pip 不支持额外的 python 包,如何在 Datalab 上安装它们?

我尝试使用 pip 在 Datalab 中安装底图:

并得到错误:

如果 pip 不支持额外的软件包,如何在 Datalab 上安装它们?

0 投票
1 回答
174 浏览

git - 将 GitHub 存储库添加到 Google Cloud 数据实验室实例(多个存储库?)

从 Cloud Datalab 开始,启动初始实例并找到 git 存储库。我想从 Github 添加一个现有的 Repo,其中有一个项目。查看了有关从 GitHub 添加遥控器的信息,但第二行说单击“开始”,据我所知,这并不存在,因为我有一个 git 存储库(默认存储库)所以我想我只能有一个,我必须消灭当前的一个?那,不经意间,似乎没有意义?我有很多我可能想要使用的存储在 Github 上?我需要做什么?我错过了什么?

还指出,我不应该在回购(许可证)中有数据,为了方便起见,我确实有示例数据。感谢评论。

0 投票
2 回答
372 浏览

google-app-engine - 请求将数据输入和输出 Google Cloud Datalab 的基本 Notebook 示例

我已经开始尝试使用 Google Cloud datalab。虽然我知道它是一个 Beta 产品,但至少可以说,我发现 Doc 非常令人沮丧。

这里的问题和缺乏回应以及在项目可用的几个月里缺乏新的修订或文档让我想知道是否对产品有任何承诺?

开始是一个笔记本,它显示从外部源到数据存储系统和大查询系统的数据摄取。这是一个常见的用例。我想使用我自己的数据,有一个笔记本来摄取它会很棒。似乎不需要付出巨大的努力就可以做到?它会让我(和其他人)摆脱这种混乱,试图将来自各种产品和工作空间的各种简洁文档链接起来并一起工作。

除了更好地解释 Git hub 连接过程(之前的问题))

0 投票
1 回答
2772 浏览

google-oauth - Cloud Datalab 中的身份验证错误:“ImportError:没有名为 gce 的模块”

我和其他人在各种不同的 GCP 项目中遇到了以下问题,并且在几天前相同代码工作的情况下。

我现在再次完成所有步骤,只是为了确保我仍然看到相同的东西。我从删除 GCP 项目中正在运行的 Cloud Datalab 实例开始,然后重新开始:首先部署 Datalab,然后“开始使用”Datalab。

然后,我选择一个预先存在的笔记本,它以以下几行开头:

这在过去对我和其他人都有效。现在我得到了这个 ImportError:

有什么改变吗?以前名为“gce”的模块是否已重命名?我需要创建凭据吗?(该项目有一个默认的 App Engine 服务帐户和一个默认的 Compute Engine 服务帐户,并且我认为可能需要启用的所有 API 都已启用。)

2016 年 4 月 20 日更新:大约一个月没有尝试重复此操作后,我昨天再次查看此内容。我第一次尝试重新运行我上个月使用的同一个笔记本时,我需要取出我因这个问题而添加的修复程序才能让它工作。但是今天同样的代码将再次不起作用。与此同时,我注意到建议已经更新,所以我现在将介绍推荐的方法。

在这里查看所需 的特定版本似乎是: httplib2>=0.8,<1; 任何oauth2client;六>=1.6.1,<2; 和 uritemplate>=0.6,<1。(允许早期 oauth2client 版本的更改似乎已在 3 月 14 日提交,但Pypi显示最新版本为 2 月 20 日上传的 1.5.0,这与发布页面一致,即 1.5.0 于 2 月 19 日发布,这可能是这个问题最初出现的时候,虽然我有几个星期没有注意到它。)

我无法进一步尝试 Anthonios 描述的 3 个选项,因为我在尝试使用 Datalab 时反复出现“连接失败”或其他错误。我将尽快再次尝试更新此问题。

0 投票
2 回答
566 浏览

python - 为什么我无法在 Cloud Datalab 上安装 pandas-profiling?

我喜欢用于初始数据探索的主要工具之一:

错误信息:

0 投票
10 回答
45289 浏览

python - 将 Pandas DataFrame 写入 Google Cloud Storage 或 BigQuery

您好,感谢您的时间和考虑。我正在 Google Cloud Platform / Datalab 中开发 Jupyter Notebook。我创建了一个 Pandas DataFrame,并希望将此 DataFrame 写入 Google Cloud Storage(GCS) 和/或 BigQuery。我在 GCS 中有一个存储桶,并通过以下代码创建了以下对象:

我已经尝试了基于 Google Datalab 文档的各种方法,但仍然失败。谢谢

0 投票
1 回答
224 浏览

python - 在 Python 中使用后释放缓冲区空间?

所以我正在使用谷歌云数据实验室,我使用 %%storage read 命令将一个大文件(2,000,000 行)读入text变量,然后我必须使用 BytesIO 将其处理成熊猫数据帧,例如df_new=pd.read_csv(BytesIO(text))

所以现在我不需要text变量或其内容,(所有进一步的处理都已完成df_new,我怎样才能删除它(text)并释放内存(我当然不需要两份 200 万条记录数据集的副本) ...)

0 投票
1 回答
451 浏览

google-cloud-datalab - 在 Google Datalab 笔记本上停止执行单元的最佳方法是什么?

如果满足某些条件,我想停止在 Google Datalab 笔记本上执行执行 python 命令的单元格。

不影响笔记本其余部分的首选方法是什么?

会使笔记本崩溃。

0 投票
1 回答
1017 浏览

jupyter-notebook - 终止并重新启动 Google DataLab 实例?

我在处理较大的数据集时发现内核可能会死机,这也是我在本地机器上的经验。有时它会回来,有时不会。因此,即使是树面板也不会对终止错误的内核做出反应。EG“重启”不起作用,服务器本身似乎死了。所以树视图不会响应或刷新。在我的本地机器上,我只是杀死终端实例并重新开始。

重新启动一切的“正确”方法是什么?

FWIW 实例似乎固定在 150% cpu 利用率 atm

相关:有没有办法让长时间运行的东西工作?我正在尝试在 2mm 记录数据集上使用报告生成器(pandas-profiling)。在我的本地工作。

0 投票
1 回答
507 浏览

jupyter-notebook - 在 Google Cloud Datalab 中执行 IPyWidgets

对于一个项目,我们尝试使用 IPyWidgets 扩展 Google Cloud Datalab。当我们在本地的 jupyter notebook 中(不是在 google-cloud-datalab 中)尝试 IPyWidgets 时,一切都按预期运行(即我们试图显示一个 Text 字段,它有效)。当我们尝试在 Google Cloud Datalab 中执行相同的代码时,它会失败。在 Web 控制台中,我们看到以下错误:

错误一:

错误2:

奇怪的是,当 google-cloud-datalab 运行时,我们转到 jupyter notebook(在端口 9000 上),我们在那里执行代码,它就可以工作了。

我们是否需要对 nb.html 和/或 static.ts 进行更改才能使其正常工作?

问题:有没有办法在 Google Cloud Datalab 上执行 IPyWidgets?

问候,布莱希特

编辑:我现在可以从 google-cloud-datalab 中的 IPyWidgets 加载 js 和 css 文件(对于那些想知道的人,您需要更改 static.ts)。唯一剩下的问题(希望如此)是我们收到以下错误:

"Error: Could not determine where the display message was from. Widget will not be displayed".

这是因为

为空(ipywidgets/widgets/js/manager.js 的第 556 行)。我认为改变 static.ts 是不够的?