问题标签 [data-science-experience]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1434 浏览

apache-spark - !pip install nltk -> 权限被拒绝

我正在尝试使用以下笔记本命令安装 nltk:

但是,这会引发以下错误:

如何从 Jupyter 笔记本安装 nltk?请注意,bluemix 上的 spark 环境只能通过 notebook 访问。她无法进入环境。

0 投票
1 回答
74 浏览

apache-spark - bluemix 上的 spark 作业是否可以查看操作系统上其他进程的列表?

从 spark 连接到第三方系统的一种常见方法是提供系统的凭据作为 spark 脚本的参数。然而,这引发了一些关于安全性的问题。例如,查看这个问题Bluemix spark-submit -- How to secure credentials required by my Scala jar

在 bluemix 上运行的 spark 作业是否可以查看操作系统上其他进程的列表?即一个作业是否可以运行相当于ps -awx检查在 spark 集群上运行的进程以及传递给这些进程的参数?我猜这是不可能的设计目标,但最好验证这一点。

0 投票
2 回答
100 浏览

apache-spark - 需要 Bluemix Analytics for Apache Spark 日志文件信息

在调试我的 spark notebook 时,我想了解更多信息。我找到了一些日志文件:

这些文件是:

哪些应用程序会记录到这些文件中,哪些信息会写入这些文件中的每一个?

0 投票
1 回答
222 浏览

apache-spark - 在 Bluemix 上的 Python 笔记本中安装密码学 python 模块

正如这里建议的那样,我正在尝试

这不起作用,因为我不允许以root.

0 投票
1 回答
445 浏览

python - 如何列出 IBM Spark 服务上预装的 Python 包

2019 年 8 月更新:这个问题不再相关。它指的是已退役的 Apache Spark 即服务产品。Watson Studio 中的当前 Spark 后端使用不同的技术。

在 Python 笔记本中,我可以执行!pip freeze以获取已安装包的列表。但结果是一个空列表,或者只显示我自己安装的几个包。直到几周前,该命令才会返回所有软件包的列表,包括 IBM 预安装的软件包。我现在如何获得完整列表?

0 投票
1 回答
123 浏览

apache-spark - hellospark_2.10-1.0.jar 的 %AddJar 给出名称:java.util.zip.ZipException 消息

我正在尝试在 ibm bluemix 的新笔记本中运行 AddJar。

但是,我不断收到此错误-

我尝试了其他链接中指定的所有类型的 URL - 原始、文件等,但没有帮助。

hellospark_2.10-1.0.jar 的 %AddJar 给出名称:java.util.zip.ZipException 消息:打开 zip 文件时出错

请指教。

谢谢拉吉

0 投票
1 回答
778 浏览

matplotlib - matplotlib - ImportError:没有名为 _tkinter 的模块

我有一个带有以下代码的简单笔记本:

但是,在运行它时,我收到以下错误:

我在同一个项目中有另一个笔记本,它能够毫无问题地运行该语句。

数据科学体验是一项托管服务,因此您没有安装 _tkinter 的 root 访问权限。

完整的堆栈跟踪:

0 投票
1 回答
331 浏览

apache-spark - 如何使用 confluent-kafka-python 从 Data Science Experience / Spark as a Service 连接到 Message Hub?

Bluemix MessageHub 文档将 python 用户指向 confluent kafka 库:

在此处输入图像描述

所以我尝试安装:

但是,我遇到了这个错误:

0 投票
2 回答
84 浏览

apache-spark - 无法在 DSX 上的 jupyter notebook 中保存更改

有时,我无法将更改保存到 DSX 中的笔记本。我相信这是因为我的会话已超时。

如何防止我的更改丢失?

0 投票
3 回答
6264 浏览

r - install.packages("tm") -> "依赖 'slam' 不可用"

我正在尝试tm在 IBM 的 Data Science Experience (DSX) 上安装该软件包:

但是,我遇到了这个问题:

这篇文章建议 R 版本3.3.1 will解决了这个问题,但是 DSX 上的 R 版本是:R version 3.3.0 (2016-05-03)

如何在 IBM DSX 上解决此问题?请注意,您在 DSX 上没有 root 访问权限。

我在 stackoverflow 上看到过类似的问题,但没有人询问如何解决 IBM DSX 上的问题,例如安装 TM 包时依赖项“slam”不可用


更新:

回报: