0

我需要在 Azure Jupyter/iPython Notebook 中下载自定义数据集。我的最终目标是安装一个 R 包。为了能够做到这一点,需要以代码下载包(数据集)。我遵循了 Andrie de Vries 在这篇文章的评论部分中概述的步骤:Jupyter Notebooks with R in Azure ML Studio

将包作为 ZIP 文件上传没有问题,但是当我在笔记本中运行代码时出现错误:

curl(x$DownloadLocation,handle = h,open = conn)中的错误:从对等 Traceback 接收数据时失败:

  1. 下载.datasets(ws,“plotly_3.6.0.tar.gz.zip”)
  2. lapply(1:nrow(datasets), function(j) get_dataset(datasets[j, . ], ...))
  3. 有趣的(1L[[1L]],...)
  4. get_dataset(数据集[j, ], ...)
  5. curl(x$DownloadLocation,句柄 = h,打开 = conn)

所以我将我的代码简化为:

library("AzureML")
ws <- workspace()
ds <- datasets(ws)
ds$Name

data <- download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
head(data)

其中“plotly_3.6.0.tar.gz.zip”是我的数据类型为“Zip”的数据集的名称。不幸的是,这会导致相同的错误。为了排除数据类型问题,我还尝试下载我的另一个数据集,它的数据类型为“数据集”。也是同样的错误。

现在我将要下载的数据集更改为 AzureML Studio 的示例数据集之一。“text.preprocessing.zip”是数据类型 Zip

data <- download.datasets(ws, "text.preprocessing.zip")

“航班延误数据”的数据类型为 GenericCSV

data <- download.datasets(ws, "Flight Delays Data")

两个样本数据集都可以毫无问题地下载。

那么为什么我不能下载我自己保存的数据集呢?

我在 download.datasets 函数的文档中找不到任何有用的东西。不在rdocumentation.org上,也不在cran.r-project.org 上(第 17-18 页)

4

2 回答 2

0

看来我得到的错误是由于(当时早期的)Azure ML Studio 中的一个错误。

在Daniel Prager的回复后,我再次尝试,结果发现我的代码按预期工作,没有任何更改。不需要添加idand参数。auth

于 2017-07-18T06:18:49.890 回答
0

尝试这个:

library(AzureML)
ws <- workspace(
id = "your AzureML ID",
auth = "your AzureML Key"
)
name <- "Name of your saved data"
ws <- workspace()
于 2017-06-15T16:12:49.940 回答