2

我在 R 笔记本中对一些数据进行了评分,并使用 write.csv 方法创建了存储在数据框中的评分数据的 CSV 文件。在 DSX 上检索此文件的最佳方法是什么?

4

2 回答 2

1

从 Data Science Experience (DSX) 中获取数据的最简单方法是将其写入对象存储。

特别是对于 R,有几个选项可以将数据放入对象存储中:

  • objectStoreR - 是我们编写的一个简单的 R 包,可以轻松获取或放入对象存储容器中的数据。自述文件应该提供足够的代码来开始。如果您缺少任何功能,请给我们发送 Github 问题。
  • ibmos2spark - 是另一个专门设计用于帮助对象存储 i/o 与 Spark 对象一起使用的选项

如果您使用的是 Python,我建议您查看我关于此主题的博客。

在对象存储容器中拥有数据后,导航到左侧主导航下的“对象存储”。这将列出对象存储服务中的所有容器,找到与您的项目关联的容器,然后您可以选择文件并将其下载为可用操作之一。

于 2017-03-31T17:52:21.417 回答
0

当您写入文件系统时,您可以使用服务器上的文件。例如,在 Python 笔记本中,您可以使用!ls列出文件或!cat <filename>查看内容。但是我们目前没有简单的方法将文件从服务器传输到您的工作站。因此,我同意 Greg Filla 的回答,即写入对象存储而不是文件系统是使您的结果可下载的最佳方式。

不过,如果您的文件很小且格式不重要,您可以使用!cat <filename>笔记本的输出并将其复制到文本编辑器中。对于二进制文件,或者当格式化很重要时,我还在!base64 <filename>笔记本中用于编码,base64 -d在工作站上用于解码文件。但这很麻烦。

于 2017-04-03T05:48:09.313 回答