问题标签 [spark-notebook]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

84 问题

0 投票

1 回答

163 浏览

scala - Spark Notebook：GeoPointsChart 是否接受数据框？

我有一个数据框，它有两列纬度和经度。我把它传给了 GeoPointsChart。输出是“显示 1000 行”，但实际上并没有向我显示任何内容。有没有人遇到过同样的问题？这是一个语法错误吗？

2017-04-22T10:09:57.197

0 投票

2 回答

878 浏览

spark-notebook - 将外部 jar 加载到 spark-notebook 中失败

我正在尝试从笔记本连接到 redshift，到目前为止我已经完成了以下操作 -

为笔记本配置的元数据

检查浏览器控制台以确保在重新启动内核后加载此库

还有其他人遇到这个问题或解决了这个问题吗？

我也注意到另一个依赖项的类似问题，配置中是否缺少任何东西？

在笔记本中尝试时间序列示例 - notebooks/timeseries/Spark-Timeseries.snb.ipynb 请注意元数据中用于自定义依赖项的现有条目 -

快速验证此包的可用性@ https://spark-packages.org/package/sryza/spark-timeseries （更新元数据以包含此行）

重新启动内核后 - 加载验证库

spark-notebook

2017-08-23T07:04:31.857

0 投票

0 回答

79 浏览

scala - Spark notebooks 比执行 jar 更快

我已经在 spark notebook 中完成了一些代码，我尝试将它移动到一个真实的项目中，并使用它sbt来生成一个jar，然后使用它spark-submit来执行它。

问题：在spark notebooks中只需要10分钟就可以得到结果，但是当我使用命令spark-submit时，需要将近3个小时才能得到结果。

信息：我配置的 spark、scala 版本和参数（主 url、执行核心/内存等）在 notebook 和 spark-submit 之间都是相同的。

嫌疑人1：可能是因为日志(LogFactory.getLog().info("xxxx"))？这使程序花费太多时间来打印或保存它们？

嫌疑人2：可能是因为密码？我没有对notebook的代码做任何大的改动，只是创建一个函数，把代码放在里面运行。我应该做一些分区还是什么？

scala apache-spark spark-submit spark-notebook

2017-10-18T18:59:39.267

0 投票

0 回答

198 浏览

scala - Spark Notebook 糟糕，发生错误

我从http://spark-notebook.io/下载了 spark notebook 。我有 spark-notebook-0.7.0-scala-2.10.6-spark-2.0.1-hadoop-2.7.2。它适用于我有 Ubuntu 14.04 的笔记本电脑。但是同一个笔记本不能在我也有 Ubuntu 14.04 的桌面上运行。服务器运行，但在浏览器 ( http://localhost:9001/ ) 上，它显示 Oops, an error occurred 此异常已用 id 75mgeof4j 记录（附截图）。