问题标签 [jupyter-scala]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scala - jupyter-scala 安装在代理后面
我正在尝试安装 jupyter-scala 以使 scala 内核与 jupyterlab 一起使用。我在代理后面,它正在超时。我正确设置了 http(s)_proxy 主机和端口环境变量。
按照此处的说明操作:https ://github.com/alexarchambault/jupyter-scala#jupyter-installation
查看 jupyter-scala 和 coursier,我找不到可以设置代理设置的位置。有人知道吗?
谢谢!
命令运行:sh -x -vvvv jupyter-scala
和有趣的位+错误:
当我运行wget https://oss.sonatype.org/content/repositories/releases/io/get-coursier/coursier-cli_2.11/1.0.0-RC1/coursier-cli_2.11-1.0.0-RC1-standalone.jar
jar 下载时,网址也很好。
apache-spark - 将 Jupyterhub+DockerSpawner+all-spark-notebook 与现有 spark 集群一起使用
我在一台机器上设置了 JupyterHub + DockerSpawner + all-spark-notebook,并且我有一个现有的 spark 集群。
我可以登录并启动服务器,但是如何使笔记本(Toree)访问现有的火花集群?
我搜索了一下,发现有人扩展了 all-spark-notebook docker 映像并重新安装了 Toree。
https://github.com/jupyter/docker-stacks/wiki/Docker-Recipes#use-jupyterall-spark-notebooks-with-an-existing-sparkyarn-cluster
有没有更简单的方法来实现目标?DockerSpawner 可以接受任何可以转移到 Toree 内核的参数吗?
scala - 如何将 Jupyter notebook scala 内核与 apache spark 集成?
我已经根据这个文档安装了 Scala 内核:https ://github.com/jupyter-scala/jupyter-scala 内核在那里:
当我尝试在笔记本中使用 Spark 时,我得到了这个:
我试过了:
- 将 SPARK_HOME 和 CLASSPATH 设置为 $SPARK_HOME/jars 的位置
- 在 kernel.json 中设置指向 $SPARK_HOME/jars 的 -cp 选项
- 在导入之前设置 classpath.add 调用
这些都没有帮助。请注意我不想使用 Toree,我想在 Jupyter 中使用独立的 spark 和 Scala 内核。这里也报告了一个类似的问题:https ://github.com/jupyter-scala/jupyter-scala/issues/63
scala - 无法获取火花数据帧的 first()
我正在尝试使用 spark 将数据从 s3 存储桶加载到我的 emr 笔记本中(在运行 spark 2.4 的 emr 集群上)
我创建了 EMR 笔记本,它创建了一个 sparkSession 作为 spark,并且可以分配
我得到回应
连接:org.apache.spark.sql.DataFrame = [值:bigint]
这是预期的,但是当我运行时:
connections.first()
我得到输出:
org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 8.0 failed 4 times, most recent failure: Lost task 0.3 in stage 8.0 (TID 55, ip-10-0-251-222.ec2.internal, executor 4): java.lang.ClassCastException: [B cannot be cast to java.lang.Number
(加上大约 100 多行,它不会让我添加)
为什么我不能取一个充满 bigint 的数据帧的第一个值?