“apache-zeppelin”的相关标签问题

0 投票

8 回答

3522 浏览

build - 安装 Apache Zeppelin 的构建错误

我想尽办法让 Apache Zeppelin 在我的 linux VM 上运行。我正在关注本教程：

http://madhukaudantha.blogspot.ca/2015/03/building-apache-zeppelin.html

我做了以下事情：

git克隆到机器
现在尝试运行“mvn clean package”

我得到以下错误摘要，我真的需要让它运行。

我曾尝试通过他们的电子邮件 (users@zeppelin.incubator.apache.org) 联系 apache 孵化器团队，但电子邮件被退回。生病继续反弹寻找解决方案。

build apache-zeppelin

2015-04-29T17:14:02.577

0 投票

1 回答

3601 浏览

amazon-web-services - 如何在现有的 Apache Spark 独立集群上安装 Apache Zeppelin

我在 AWS 上有一个现有的 Apache Spark（1.3 版本）独立集群，我想安装 Apache Zeppelin。

我有一个很简单的问题，我必须在 Spark 的 master 上安装 Zeppelin 吗？

如果答案是肯定的，我可以使用该指南https://github.com/apache/incubator-zeppelin#build吗？

谢谢大家

2015-05-07T13:37:25.603

0 投票

1 回答

401 浏览

java - 从 java getCanonicalHostName 方法使用 AWS 上的公共 IP

我正在尝试将 AWS 用作可扩展的分析工具。我正在使用 apache zeppelin 作为 Spark 集群的交互式 shell，并尝试使用 wisp 进行绘图。这导致了一个问题，因为 wisp 中的绘图方法是基于我认为的码头服务器启动 Web 应用程序。这在我的本地机器上运行良好，但在 AWS 上它不起作用，因为它获取私有 IP 地址而不是公共 IP 地址。

在 wisp 中，它用于java.net.InetAddress.getLocalHost.getCanonicalHostName 检索机器的 IP 地址。这总是返回私有 FQDN 地址。如何让 java 函数返回 AWS 提供的公共 IP 地址或 FQDN，而无需在每次启动集群和重建时对某些内容进行硬编码？

我尝试更改 /etc/hosts 和 /etc/hostname 但两者都没有效果。我真的不知道从哪里java.net.InetAddress.getLocalHost.getCanonicalHostName 得到它的地址。

非常感谢任何帮助或建议。

院长

java amazon-web-services apache-zeppelin

2015-05-29T14:41:47.053

0 投票

1 回答

3250 浏览

angularjs - Apache zeppelin - 带有角度和 zeppelin 解释器的变量范围

我正在玩这个教程

https://github.com/apache/incubator-zeppelin/pull/27#issuecomment-90769401

似乎 val selectedTable的范围可以从 %%angular 解释器访问，但不能从 zeppelin 解释器访问。

例如，从 turorial 的第 2 段

}

当我使用 select 并将值从“bank”切换到“married”时，{{selectedTable}}（打印标题的%%angula 解释器）的值立即改变（除了第一次之外，没有点击播放按钮）但查询没有运行。换句话说，没有数据加载到图表中。

如果您在此 url https://youtu.be/QdjZyOkcG_w?t=15观看视频，您会看到每次选择具有不同的值时，所有查询都会一一执行。

有没有人有同样的问题？

先感谢您

angularjs apache-spark apache-zeppelin

2015-06-08T12:59:05.283

0 投票

1 回答

640 浏览

installation - spark-1.4 与 zeppelin 安装

成功安装 spark 1.4 后，我尝试安装 Apache Zeppelin 用于类似笔记本的实用程序。

从其他一些在线资源中，我下载并解压缩了 zeppelin 源代码并开始使用 Maven 编译

（环境中导出的spark home）

我在大约 4 分钟内得到了不错的 INFO 输出，但是在以下情况下，事情因错误而停止：

这是错误消息：

有什么我忘记或应该事先修改的吗？

感谢你的帮助。

installation apache-spark apache-zeppelin

2015-06-13T02:22:24.027

0 投票

2 回答

4751 浏览

scala - Zeppelin SqlContext registerTempTable 问题

我正在尝试使用 zeppelin 中的 sqlContext.jsonFile 访问一些 json 数据...

以下代码执行没有任何错误：

输出：

导入 sys.process._ sqlCon: org.apache.spark.sql.SQLContext = org.apache.spark.sql.SQLContext@7034473 jfile: org.apache.spark.sql.DataFrame = [ id: struct, content: string,标签：数组，分数：结构，会话：字符串，时间戳：bigint，tweetId：bigint，用户名：字符串] 导入 sqlContext.implicits。

接下来我验证我刚刚注册的表名

sqlCon.tableNames().foreach(println)

输出：

jTable01

但是当我尝试运行时出现错误：

输出：

没有这样的表 jTable01；第 1 行第 14 行

同时，当我为“银行”运行教程示例时，它可以工作....我能做出的唯一区别是，在银行教程中，我们使用的是sc.textFile，但在我的情况下，我想使用sqlContext.jsonFile。

您能否提供任何指导以解决此问题？

scala apache-spark apache-spark-sql apache-zeppelin

2015-06-13T13:13:32.803

0 投票

1 回答

37371 浏览

python - 将“SPARK_HOME”设置为什么？

安装 apache-maven-3.3.3，scala 2.11.6，然后运行：

最后：

然后运行服务器：

运行一个以开头的简单笔记本%pyspark，我收到一个关于py4j找不到的错误。刚刚做了pip install py4j（参考）。

现在我收到此错误：

我尝试将我的设置SPARK_HOME为：/spark/python:/spark/python/lib。没变。

python apache-spark pythonpath pyspark apache-zeppelin

2015-06-14T00:12:30.357

0 投票

0 回答

1943 浏览

ipython - Zeppelin：构造函数 org.apache.spark.api.python.PythonRDD 不存在

IPython 笔记本

按照文档（PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark）开始，然后填写：

输出：sc.textFile(filename).count() = 500

Apache Zeppelin 笔记本

输出： (<class 'py4j.protocol.Py4JError'>, Py4JError(u'An error occurred while calling None.org.apache.spark.api.python.PythonRDD. Trace:\npy4j.Py4JException: Constructor org.apache.spark.api.python.PythonRDD([class org.apache.spark.rdd.MapPartitionsRDD, class [B, class java.util.HashMap, class java.util.ArrayList, class java.lang.Boolean, class java.lang.String, class java.lang.String, class java.util.ArrayList, class org.apache.spark.Accumulator]) does not exist\n\tat py4j.reflection.ReflectionEngine.getConstructor(ReflectionEngine.java:184)\n\tat py4j.reflection.ReflectionEngine.getConstructor(ReflectionEngine.java:202)\n\tat py4j.Gateway.invoke(Gateway.java:213)\n\tat py4j.commands.ConstructorCommand.invokeConstructor(ConstructorCommand.java:79)\n\tat py4j.commands.ConstructorCommand.execute(ConstructorCommand.java:68)\n\tat py4j.GatewayConnection.run(GatewayConnection.java:207)\n\tat java.lang.Thread.run(Thread.java:745)\n\n',), <traceback object at 0x7f3f79e24440>)

ipython ipython-notebook pyspark py4j apache-zeppelin

2015-06-14T07:18:49.570

0 投票

3 回答

4302 浏览

build - Zeppelin 构建失败

我正在尝试为 spark1.0.0 和 hadoop1.0.3 安装 zeppelin。

可能重复：安装 Apache Zeppelin 产生的构建错误

好吧，上面的线程并没有太大帮助。我的输出与上述线程完全相同：Web 应用程序无法编译。

我运行的命令是'mvn install -DskipTests -Dspark.version=1.0.0 -Dhadoop.version=1.0.3'

我有 maven 3.0.4 / java 1.8 / npm 1.1.4

是的，我确实已经从 git:// 切换到 https:// 并再次尝试，但没有成功。

build apache-zeppelin

2015-06-16T02:57:11.837

0 投票

8 回答

12310 浏览

apache-zeppelin - Apache zeppelin 进程死亡

我正在尝试在带有 Hadoop 1.0.3 和 Spark 1.4.0 的 Ubuntu14 上运行 zeppelin。我已经完成了源代码的构建，并且所有的包都成功完成了构建。但是当我运行守护进程时，它失败并说 Zeppelin 进程已经死亡。

有什么想法会出错吗？

它说它找不到肯定存在的日志文件夹和运行文件夹。

apache-zeppelin

2015-06-17T03:14:05.790

问题标签 [apache-zeppelin]

IPython 笔记本

Apache Zeppelin 笔记本

Reference