我需要在 Azure Jupyter/iPython Notebook 中下载自定义数据集。我的最终目标是安装一个 R 包。为了能够做到这一点,需要以代码下载包(数据集)。我遵循了 Andrie de Vries 在这篇文章的评论部分中概述的步骤:Jupyter Notebooks with R in Azure ML Studio。
将包作为 ZIP 文件上传没有问题,但是当我在笔记本中运行代码时出现错误:
curl(x$DownloadLocation,handle = h,open = conn)中的错误:从对等 Traceback 接收数据时失败:
- 下载.datasets(ws,“plotly_3.6.0.tar.gz.zip”)
- lapply(1:nrow(datasets), function(j) get_dataset(datasets[j, . ], ...))
- 有趣的(1L[[1L]],...)
- get_dataset(数据集[j, ], ...)
- curl(x$DownloadLocation,句柄 = h,打开 = conn)
所以我将我的代码简化为:
library("AzureML")
ws <- workspace()
ds <- datasets(ws)
ds$Name
data <- download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
head(data)
其中“plotly_3.6.0.tar.gz.zip”是我的数据类型为“Zip”的数据集的名称。不幸的是,这会导致相同的错误。为了排除数据类型问题,我还尝试下载我的另一个数据集,它的数据类型为“数据集”。也是同样的错误。
现在我将要下载的数据集更改为 AzureML Studio 的示例数据集之一。“text.preprocessing.zip”是数据类型 Zip
data <- download.datasets(ws, "text.preprocessing.zip")
“航班延误数据”的数据类型为 GenericCSV
data <- download.datasets(ws, "Flight Delays Data")
两个样本数据集都可以毫无问题地下载。
那么为什么我不能下载我自己保存的数据集呢?
我在 download.datasets 函数的文档中找不到任何有用的东西。不在rdocumentation.org上,也不在cran.r-project.org 上(第 17-18 页)。