问题标签 [apache-zeppelin]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-s3 - 使用火花解释器从 Zeppelin 连接 S3
我正在尝试使用 Spark 和 Zeppelin 进行一些基本分析。
我已经使用spark-ec2中的步骤设置了 spark 集群 我还使用本博客中的步骤在 EC2 中设置了 zeppelin
我已经在 zeppelin notebook 中使用以下代码添加了我想使用的库
下面的代码是从 S3 读取 CSV 文件
我收到以下异常
我已经研究了如何使用 Zeppelin 访问 aws spark-ec2 集群和 s3 存储桶
如答案中所述,我已经更改了安全性并能够与 Spark 连接。sc.version
印刷1.4.0
我还研究了为什么 Zeppelin notebook 无法连接到 S3。在答案中说使用我不想做的本地火花。我想使用我的 EC2 实例中存在的 spark 集群。
我在这里错过了什么步骤?
intellisense - Apache Zeppelin 有智能感知吗?
Apache Zeppelin 在其笔记本 ui 中是否具有智能感知/自动完成支持?
如果是这样,我该如何使用它?
我尝试在互联网上搜索,但未能找到有效的来源。这个https://github.com/NFLabs/zeppelin/issues/248说要使用ctrl-
,但它没有用。我想知道在项目转移到 Apache 后是否删除了智能感知支持。
apache-zeppelin - Zeppelin 可以自定义皮肤吗?
Zeppelin 可以自定义皮肤吗?换句话说,将 Zeppelin 的标志换成别的东西?
java - 如何在调试模式下启动 Apache Zeppelin?
我需要在调试模式下启动 Zeppelin,以便在 Intellij 中添加断点以远程调试代码。
我该怎么做呢?没有可用的文档。
pandas - 在 zeppelin 中将 pandas 数据帧转换为 spark 数据帧
我是齐柏林飞艇的新手。我有一个用例,其中我有一个 pandas 数据框。我需要使用 zeppelin 的内置图表来可视化集合我这里没有明确的方法。我的理解是使用 zeppelin,如果它是 RDD 格式,我们可以将数据可视化。所以,我想将 pandas 数据帧转换为 spark 数据帧,然后进行一些查询(使用 sql),我将可视化。首先,我尝试将熊猫数据框转换为火花,但我失败了
我得到了以下错误
有人可以帮我吗?另外,如果我在任何地方错了,请纠正我。
apache-spark - 使用 spark-csv 在 zeppelin 中读取 csv 文件
我想在 Zeppelin 中阅读 csv 文件并想使用 databricks 的 spark-csv 包:https ://github.com/databricks/spark-csv
在 spark-shell 中,我可以使用 spark-csv
但是我如何告诉 Zeppelin 使用那个包呢?
提前致谢!
maven - Apache Zeppelin 构建在 Apache Geode 解释器阶段失败,返回代码 409,ReasonPhrase:冲突
目前是整个 Ubuntu/Maven/hadoop/spark/zeppelin 的新手,并且在 zeppelin 安装中被卡住了一段时间。有人可以帮我解决这个问题吗?这也是我关于堆栈溢出的第一篇文章,因此请告诉我是否可以以任何方式改进此问题的内容以使其更易于访问。谢谢
问题:
在 Ubuntu 中安装 Apache Zeppelin 在 Apache Geode 解释器阶段失败
当前安装的版本:
- Ubuntu 14.04 LTS
- Spark 1.5.1
- Hadoop 2.6.0
- Maven 3.0.5
- Java 1.7.0_79
- Zeppelin(来自 GIT 的最新版本)
调用终端(作为非root用户):
输出:
amazon-web-services - 来自安装在 EMR 上的 Zeppelin 的权限被拒绝访问 S3 文件
在 EMR 上启动集群
设置:
然后我在本地机器上获得 Zeppelin UI,地址为:
成功
创建一个新笔记本:运行
返回
然后我尝试将数据从 S3 加载到 spark 中
然后得到错误
cassandra - Zeppelin spark RDD 命令失败但在 spark-shell 中工作
我已经设置了一个独立的单节点“集群”,运行以下内容:
- 卡桑德拉 2.2.2
- 火花 1.5.1
- 项目清单
- 为 Spark-Cassandra-Connector 1.5.0-M2 编译的 fat jar
- 编译的 Zeppelin 0.6 快照编译为: mvn -Pspark-1.5 -Dspark.version=1.5.1 -Dhadoop.version=2.6.0 -Phadoop-2.4 -DskipTests clean package
我可以很好地使用 spark shell 从 cassandra 检索数据
我已将 Zeppelin-env.sh 更改如下:
然后我开始将段落添加到笔记本并首先导入以下内容:
不确定是否所有这些都是必要的。这一段运行良好。
然后我执行以下操作:
这运行良好并返回:
然后下一段 - 运行以下 2 个语句 - 第一个成功,第二个失败:
结果:
为什么调用 first 失败。诸如 sc.fromTextFile 之类的调用也会失败。
以下也有效:
但这不会:
请协助,因为这让我发疯。特别是因为火花壳可以工作,但这并没有或至少看起来部分损坏。
谢谢
apache-zeppelin - 如何使用 zeppelin REST API 创建带有加载代码的段落的笔记本
我想通过 zeppelin REST API 创建 zeppelin notebook。我不想创建一个空笔记本,而是想创建一个包含一些 scala 代码的笔记本。
创建这样的笔记本需要传递哪些参数?或者是否可以通过一些小的修改来克隆笔记本。就像,我可以有一个带有参数化字段的模板笔记本。在克隆期间,我会将参数替换为实际值。有可能这样做吗?
不幸的是,zeppelin 文档中的示例 JSON 输入未加载。我收到以下错误。