问题标签 [apache-zeppelin]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
8 回答
3522 浏览

build - 安装 Apache Zeppelin 的构建错误

我想尽办法让 Apache Zeppelin 在我的 linux VM 上运行。我正在关注本教程:

http://madhukaudantha.blogspot.ca/2015/03/building-apache-zeppelin.html

我做了以下事情:

  1. git克隆到机器
  2. 现在尝试运行“mvn clean package”

我得到以下错误摘要,我真的需要让它运行。

我曾尝试通过他们的电子邮件 (users@zeppelin.incubator.apache.org) 联系 apache 孵化器团队,但电子邮件被退回。生病继续反弹寻找解决方案。

0 投票
1 回答
3601 浏览

amazon-web-services - 如何在现有的 Apache Spark 独立集群上安装 Apache Zeppelin

我在 AWS 上有一个现有的 Apache Spark(1.3 版本)独立集群,我想安装 Apache Zeppelin。

我有一个很简单的问题,我必须在 Spark 的 master 上安装 Zeppelin 吗?

如果答案是肯定的,我可以使用该指南https://github.com/apache/incubator-zeppelin#build吗?

谢谢大家

0 投票
1 回答
401 浏览

java - 从 java getCanonicalHostName 方法使用 AWS 上的公共 IP

我正在尝试将 AWS 用作可扩展的分析工具。我正在使用 apache zeppelin 作为 Spark 集群的交互式 shell,并尝试使用 wisp 进行绘图。这导致了一个问题,因为 wisp 中的绘图方法是基于我认为的码头服务器启动 Web 应用程序。这在我的本地机器上运行良好,但在 AWS 上它不起作用,因为它获取私有 IP 地址而不是公共 IP 地址。

在 wisp 中,它用于java.net.InetAddress.getLocalHost.getCanonicalHostName 检索机器的 IP 地址。这总是返回私有 FQDN 地址。如何让 java 函数返回 AWS 提供的公共 IP 地址或 FQDN,而无需在每次启动集群和重建时对某些内容进行硬编码?

我尝试更改 /etc/hosts 和 /etc/hostname 但两者都没有效果。我真的不知道从哪里java.net.InetAddress.getLocalHost.getCanonicalHostName 得到它的地址。

非常感谢任何帮助或建议。

院长

0 投票
1 回答
3250 浏览

angularjs - Apache zeppelin - 带有角度和 zeppelin 解释器的变量范围

我正在玩这个教程

https://github.com/apache/incubator-zeppelin/pull/27#issuecomment-90769401

似乎 val selectedTable的范围可以从 %%angular 解释器访问,但不能从 zeppelin 解释器访问。

例如,从 turorial 的第 2 段

}

当我使用 select 并将值从“bank”切换到“married”时,{{selectedTable}}(打印标题的%%angula 解释器)的值立即改变(除了第一次之外,没有点击播放按钮)但查询没有运行。换句话说,没有数据加载到图表中。

如果您在此 url https://youtu.be/QdjZyOkcG_w?t=15观看视频,您会看到每次选择具有不同的值时,所有查询都会一一执行。

有没有人有同样的问题?

先感谢您

0 投票
1 回答
640 浏览

installation - spark-1.4 与 zeppelin 安装

成功安装 spark 1.4 后,我尝试安装 Apache Zeppelin 用于类似笔记本的实用程序。

从其他一些在线资源中,我下载并解压缩了 zeppelin 源代码并开始使用 Maven 编译

(环境中导出的spark home)

我在大约 4 分钟内得到了不错的 INFO 输出,但是在以下情况下,事情因错误而停止:

这是错误消息:

有什么我忘记或应该事先修改的吗?

感谢你的帮助。

0 投票
2 回答
4751 浏览

scala - Zeppelin SqlContext registerTempTable 问题

我正在尝试使用 zeppelin 中的 sqlContext.jsonFile 访问一些 json 数据...

以下代码执行没有任何错误:

输出 :

导入 sys.process._ sqlCon: org.apache.spark.sql.SQLContext = org.apache.spark.sql.SQLContext@7034473 jfile: org.apache.spark.sql.DataFrame = [ id: struct, content: string,标签:数组,分数:结构,会话:字符串,时间戳:bigint,tweetId:bigint,用户名:字符串] 导入 sqlContext.implicits。

接下来我验证我刚刚注册的表名

sqlCon.tableNames().foreach(println)

输出 :

jTable01

但是当我尝试运行时出现错误:

输出 :

没有这样的表 jTable01;第 1 行第 14 行

同时,当我为“银行”运行教程示例时,它可以工作....我能做出的唯一区别是,在银行教程中,我们使用的是sc.textFile,但在我的情况下,我想使用sqlContext.jsonFile。

您能否提供任何指导以解决此问题?

0 投票
1 回答
37371 浏览

python - 将“SPARK_HOME”设置为什么?

安装 apache-maven-3.3.3,scala 2.11.6,然后运行:

最后:

然后运行服务器:

运行一个以 开头的简单笔记本%pyspark,我收到一个关于py4j找不到的错误。刚刚做了pip install py4j参考)。

现在我收到此错误:

我尝试将我的设置SPARK_HOME为:/spark/python:/spark/python/lib。没变。

0 投票
0 回答
1943 浏览

ipython - Zeppelin:构造函数 org.apache.spark.api.python.PythonRDD 不存在

IPython 笔记本

按照文档(PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark)开始,然后填写:

输出:sc.textFile(filename).count() = 500

Apache Zeppelin 笔记本

输出: (<class 'py4j.protocol.Py4JError'>, Py4JError(u'An error occurred while calling None.org.apache.spark.api.python.PythonRDD. Trace:\npy4j.Py4JException: Constructor org.apache.spark.api.python.PythonRDD([class org.apache.spark.rdd.MapPartitionsRDD, class [B, class java.util.HashMap, class java.util.ArrayList, class java.lang.Boolean, class java.lang.String, class java.lang.String, class java.util.ArrayList, class org.apache.spark.Accumulator]) does not exist\n\tat py4j.reflection.ReflectionEngine.getConstructor(ReflectionEngine.java:184)\n\tat py4j.reflection.ReflectionEngine.getConstructor(ReflectionEngine.java:202)\n\tat py4j.Gateway.invoke(Gateway.java:213)\n\tat py4j.commands.ConstructorCommand.invokeConstructor(ConstructorCommand.java:79)\n\tat py4j.commands.ConstructorCommand.execute(ConstructorCommand.java:68)\n\tat py4j.GatewayConnection.run(GatewayConnection.java:207)\n\tat java.lang.Thread.run(Thread.java:745)\n\n',), <traceback object at 0x7f3f79e24440>)

0 投票
3 回答
4302 浏览

build - Zeppelin 构建失败

我正在尝试为 spark1.0.0 和 hadoop1.0.3 安装 zeppelin。

可能重复:安装 Apache Zeppelin 产生的构建错误

好吧,上面的线程并没有太大帮助。我的输出与上述线程完全相同:Web 应用程序无法编译。

我运行的命令是'mvn install -DskipTests -Dspark.version=1.0.0 -Dhadoop.version=1.0.3'

我有 maven 3.0.4 / java 1.8 / npm 1.1.4

是的,我确实已经从 git:// 切换到 https:// 并再次尝试,但没有成功。

0 投票
8 回答
12310 浏览

apache-zeppelin - Apache zeppelin 进程死亡

我正在尝试在带有 Hadoop 1.0.3 和 Spark 1.4.0 的 Ubuntu14 上运行 zeppelin。我已经完成了源代码的构建,并且所有的包都成功完成了构建。但是当我运行守护进程时,它失败并说 Zeppelin 进程已经死亡。

有什么想法会出错吗?

它说它找不到肯定存在的日志文件夹和运行文件夹。