问题标签 [data-science-experience]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
102 浏览

dsx - pixiedust display 命令生成的 DSX 图像很难看

任何想法为什么 DSX 中的显示命令会提供与 Databricks 中不同的丑陋图像?另外,我看不到我什至可以像 Databricks 一样添加色调(甚至默认)。

数据块

Databricks 显示命令图像

数据科学经验

数据科学体验显示命令图像

0 投票
1 回答
729 浏览

python - IBM Watson Studio:将 ibmdbpy.frame.IdaDataFrame 转换为 pandas.core.frame.DataFrame

我对ibmdbpy.frame.IdaDataFrameIBM Watson Studio 中的类型有疑问。

我有两个数据框。第一个 typeibmdbpy.frame.IdaDataFrame和第二个 type pandas.core.frame.DataFrame

我想在 Python 中合并这两个数据框。

是否可以转换ibmdbpy.frame.IdaDataFramepandas.core.frame.DataFrame

0 投票
1 回答
1486 浏览

ibm-cloud - 从 DSX python 2.7 笔记本将 csv 写入 Ibm bluemix 对象存储

我正在尝试从 DSX Python 笔记本将 pandas 数据帧作为 CSV 写入 Bluemix 对象存储。我首先将数据框保存到“本地”CSV 文件中。然后我有一个例程尝试将文件写入对象存储。我收到 413 响应 - 对象太大。该文件只有大约 3MB。这是我的代码,基于我在此处找到的 JSON 示例:http: //datascience.ibm.com/blog/working-with-object-storage-in-data-science-experience-python-edition/

非常感谢任何帮助或指示。

0 投票
2 回答
381 浏览

postgresql - 如何在 IBM 的数据科学体验中从 pyspark 访问 postgres 表?

这是我的代码:

添加 postgres 驱动程序 jar (%Addjar -f https://jdbc.postgresql.org/download/postgresql-9.4.1207.jre7.jar )后,我收到“没有合适的驱动程序”错误。是否有从 DSX 上的 pyspark 2.0 中的 postgres 加载数据的工作示例?

0 投票
1 回答
105 浏览

ibm-cloud - dsx 写入 blue-mix 对象存储

bluemix 对象存储是否会在像 amazon s3 这样的容器内具有文件夹功能。我不确定其他人的情况,但很快就从 DSX 编写,它在容器中变得如此混乱。它就像一台无法在 C:\ drive 下创建文件夹的计算机。它一团糟。

由于其 DSX 的主存储,是 DSX 推动的这种能力。Bluemix 对象存储无文件夹功能

这是 s3 容器,您可以多么精美地组织所有S3 容器

0 投票
1 回答
225 浏览

data-science-experience - 错误:找不到函数“list_spark_kernels”

我正在按照教程从 RStudio 访问数据科学体验中的 spark。但是,教程中列出的功能不可用:

我有文件config.yml.Rprofile在我的主文件夹中:

我也尝试过采购我的 .Rprofile 但这不起作用:

list_spark_kernels()我今天早些时候尝试了该功能,效果很好。

0 投票
2 回答
2027 浏览

data-science-experience - 无法从 SPARK_HOME 或 SPARK_HOME_VERSION 检测版本

我正在尝试按照教程在 DSX 上使用 RStudio 中的 spark,但遇到以下错误:

我从 RStudio 中的连接到火花对话框中获取了上面的代码片段:

在此处输入图像描述

所以我看了看SPARK_HOME

好的,让我们检查一下 dir 是否存在:

我猜这是问题的原因?


注意: stackoverflow 上有一些类似的问题,但没有一个是关于 IBM 的数据科学体验 (DSX)。

更新1:

我尝试了以下方法:

更新 2:

我的 config.yml 的摘录。请注意,我有更多的火花服务,我刚刚粘贴了第一个:

请注意,我的 config.yml 是为我生成的。

更新 3:

我的 .Rprofile 看起来像这样:

请注意,我的 .Rprofile 是为我生成的。

更新 4:

我卸载了 sparklyr 并重新启动了两次会话。接下来我尝试运行:

但是,上述命令挂起。我停止了命令并检查了 sparklyr 的版本,这似乎没问题:

0 投票
1 回答
61 浏览

data-science-experience - 如何将自己从 Watson Studio(以前的 DSX)项目中移除?

用户可以将您添加到 Watson Studio 项目中,但是,一段时间后您可能最终属于许多其他项目。

你怎么能把自己从另一个项目中移除?是否可以这样做,或者您是否需要联系项目所有者并要求他们删除您?


另请参阅:https ://datascix.uservoice.com/forums/387207-general/suggestions/17738392-allow-me-to-leave-a-project

0 投票
1 回答
170 浏览

data-science-experience - 如何将火花包添加到 DSX 上的 Spark R 笔记本?

spark 文档显示了如何添加 spark 包:

我相信这只能在初始化会话时使用。

我们如何使用 DSX 上的笔记本为 SparkR 添加火花包?

0 投票
1 回答
117 浏览

data-science-experience - 如何在 dsx ml 管道中处理具有非标准分隔符的输入文件?

我正在尝试使用没有标题且具有::字段分隔符的数据集:

输出:

我已将文件加载到我的 dsx 管道中,但我不清楚如何让 dsx 使用::分隔符拆分此文件。

  • 我该怎么做呢?

  • 如果无法让 dsx 使用 dsx ml 管道功能重塑此文件,那么 dsx 在输入文件格式方面是否有任何先决条件?

更新:

我正在尝试使用的 ml 管道功能可以从下面的屏幕截图中看到:

在此处输入图像描述

我添加了一个数据集,但无法弄清楚如何让 dsx 识别字段分隔符:

在此处输入图像描述