我在 R 笔记本中对一些数据进行了评分,并使用 write.csv 方法创建了存储在数据框中的评分数据的 CSV 文件。在 DSX 上检索此文件的最佳方法是什么?
问问题
676 次
2 回答
1
从 Data Science Experience (DSX) 中获取数据的最简单方法是将其写入对象存储。
特别是对于 R,有几个选项可以将数据放入对象存储中:
- objectStoreR - 是我们编写的一个简单的 R 包,可以轻松获取或放入对象存储容器中的数据。自述文件应该提供足够的代码来开始。如果您缺少任何功能,请给我们发送 Github 问题。
- ibmos2spark - 是另一个专门设计用于帮助对象存储 i/o 与 Spark 对象一起使用的选项
如果您使用的是 Python,我建议您查看我关于此主题的博客。
在对象存储容器中拥有数据后,导航到左侧主导航下的“对象存储”。这将列出对象存储服务中的所有容器,找到与您的项目关联的容器,然后您可以选择文件并将其下载为可用操作之一。
于 2017-03-31T17:52:21.417 回答
0
当您写入文件系统时,您可以使用服务器上的文件。例如,在 Python 笔记本中,您可以使用!ls
列出文件或!cat <filename>
查看内容。但是我们目前没有简单的方法将文件从服务器传输到您的工作站。因此,我同意 Greg Filla 的回答,即写入对象存储而不是文件系统是使您的结果可下载的最佳方式。
不过,如果您的文件很小且格式不重要,您可以使用!cat <filename>
笔记本的输出并将其复制到文本编辑器中。对于二进制文件,或者当格式化很重要时,我还在!base64 <filename>
笔记本中用于编码,base64 -d
在工作站上用于解码文件。但这很麻烦。
于 2017-04-03T05:48:09.313 回答