问题标签 [apache-zeppelin]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
12362 浏览

apache-zeppelin - 如何在 apache zeppelin 中获得超过 100 个的 sql 结果?

当我在 apache-zeppelin 中执行此查询时,我只得到 100 个结果,“结果受 100 个限制”。信息。

所以我在 SQL 查询中附加了“限制 10000”,但它再次只返回 100 个结果。

那么,如何在 zeppelin 中获得超过 100 个的 sql 结果?

0 投票
1 回答
592 浏览

maven-3 - 构建 Zeppelin 时出现错误

git clone https://github.com/apache/incubator-zeppelin使用mvn clean package -U -DskipTests. 但是控制台给了我以下错误信息< Failed to execute goal on project zeppelin-phoenix: Could not resolve dependencies for project org.apache.zeppelin:zeppelin-phoenix:jar:0.6.0-incubating-SNAPSHOT: Could not find artifact sqlline:sqlline:jar:1.1.8 in public (http://maven.dev.sh.ctripcorp.com:8081/nexus/content/repositories/public) -> [Help 1]>,我正在想办法解决。但这似乎没用。任何人都可以帮助我并解决它吗?

0 投票
2 回答
1289 浏览

apache-zeppelin - Apache - Zeppelin 在 Ubuntu 上构建失败

我深陷其中。我已经按照这里的每一条指令(https://github.com/apache/incubator-zeppelin)安装 Apache-Zeppelin。我需要这个用于 Spark。

以下是安装在 UBUNTU (VM) 中的各种必需应用程序

从 Git Hub 克隆 Zeppelin

最初,我有 Maven 3.0 版本。建议有一个版本> 3.3..安装最新版本(3.3.9)的线程之一。

执行了以下仍然失败的命令

不知道从这里去哪里。zeppelin 文件夹中的任何设置是否需要进行任何更改?请提出建议。

0 投票
0 回答
1368 浏览

java - Zeppelin 构建失败 - 无法运行任务:“grunt --no-color”失败

我想在 OSX 10.8 上安装 Apache Zeppelin,但由于某些神秘原因构建失败。规格:Java 1.7、Maven 3.3、节点 v0.12.4 和 grunt v0.1.13。

我正在运行以下命令:

我得到以下输出:

grunt 似乎有些错误,但我不确定。

0 投票
2 回答
2978 浏览

scala - ClassNotFoundException:org.apache.spark.repl.SparkCommandLine

我是 Apache Zeppelin 的新手,我尝试在本地运行它。我尝试只运行一个简单的健全性检查以查看它是否sc存在并得到以下错误。

我为 pyspark 和 spark 1.5 编译它(我使用 spark 1.5)。我将内存增加到 5 GB,并将端口更改为 8091。

我不确定我做错了什么,所以我收到以下错误以及我应该如何解决它。

提前致谢

java.lang.ClassNotFoundException: org.apache.spark.repl.SparkCommandLine at java.net.URLClassLoader.findClass(URLClassLoader.java:381) at java.lang.ClassLoader.loadClass(ClassLoader.java:424) at sun.misc。 Launcher$AppClassLoader.loadClass(Launcher.java:331) at java.lang.ClassLoader.loadClass(ClassLoader.java:357) at org.apache.zeppelin.spark.SparkInterpreter.open(SparkInterpreter.java:401) at org.apache .zeppelin.interpreter.ClassloaderInterpreter.open(ClassloaderInterpreter.java:74) at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java:68) at org.apache.zeppelin.spark.PySparkInterpreter.getSparkInterpreter(PySparkInterpreter.java :485) 在 org.apache. org.apache.zeppelin.spark.PySparkInterpreter.createGatewayServerAndStartScript(PySparkInterpreter.java:174)。zeppelin.spark.PySparkInterpreter.open(PySparkInterpreter.java:152) at org.apache.zeppelin.interpreter.ClassloaderInterpreter.open(ClassloaderInterpreter.java:74) at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java: 68) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreterServer$InterpretJob.jobRun(RemoteInterpreterServer.java:302) 在 org.apache.zeppelin 的 org.apache.zeppelin.interpreter.LazyOpenInterpreter.interpret(LazyOpenInterpreter.java:92) .scheduler.Job.run(Job.java:171) at org.apache.zeppelin.scheduler.FIFOScheduler$1.run(FIFOScheduler.java:139) at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java: 511) 在 java.util.concurrent.FutureTask.run(FutureTask.java:266) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask。在 java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142) 的 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) 访问 $201(ScheduledThreadPoolExecutor.java:180)。 concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)

更新 我的解决方案是将我的 scala 版本从 2.11.* 降级到 2.10.*,再次构建 Apache Spark 并运行 Zeppelin。

0 投票
1 回答
1087 浏览

linux - 如何使用 linux HDInsight 更改 zeppelin 的资源

我之前使用过 Windows 版本的 HDInsight,它有一个选项卡,您可以在其中为 Zeppelin 设置每个工作节点的内核数和内存。

我按照本教程让 Zeppelin 工作: https ://azure.microsoft.com/en-us/documentation/articles/hdinsight-apache-spark-use-zeppelin-notebook/

HDInsight 的 Linux 版本使用 Ambari 来管理资源,但我似乎找不到更改 Zeppelin 设置的方法。

  • Zeppelin 不能作为左侧服务列表中的单独服务选择。当我在操作中选择“添加服务”时,似乎也无法添加它。

  • 我尝试使用覆盖在 Ambari 中编辑通用 spark 配置,然后将工作节点添加到我的新配置组中,并增加自定义 spark-defaults 中的内核和 RAM 数量。(然后单击保存并重新启动所有受影响的服务。)

  • 我尝试使用编辑火花设置

    /li>

在头节点上,但 Ambari 没有接收到。

对于每次大约需要 1000-1100 秒的查询,Zeppelin 中的性能似乎保持不变。

0 投票
0 回答
100 浏览

java - 如何从 java 客户端启动 Apache Zeppelin 服务器?

有没有办法可以从 java 客户端启动 Apache zeppelin 服务器?

我检查了https://github.com/apache/incubator-zeppelin/blob/master/zeppelin-server/src/main/java/org/apache/zeppelin/server/ZeppelinServer.java文件。

我猜服务器是在这个文件的主要方法中启动的。如果是这样,我如何从我的 java 客户端启动服务器?

0 投票
2 回答
2320 浏览

postgresql - Apache Zeppelin postgres 空指针异常

我尝试将查询连接到远程 postgres 数据库 -

我已经更新了解释器的值,但我仍然收到以下错误 -

java.lang.NullPointerException 在 org.apache.zeppelin.postgresql.PostgreSqlInterpreter.interpret(PostgreSqlInterpreter.java:288) 在 org.apache.zeppelin.postgresql.PostgreSqlInterpreter.executeSql(PostgreSqlInterpreter.java:201) 在 org.apache.zeppelin。 org.apache.zeppelin.interpreter.LazyOpenInterpreter.interpret(LazyOpenInterpreter.java:93) at org.apache.zeppelin.interpreter.remote.RemoteInterpreterServer$InterpretJob.jobRun(RemoteInterpreterServer. java:302) 在 org.apache.zeppelin.scheduler.Job.run(Job.java:171) 在 org.apache.zeppelin.scheduler.FIFOScheduler$1.run(FIFOScheduler.java:139) 在 java.util.concurrent。 Executors$RunnableAdapter.call(Executors.java:511) at java.util.concurrent.FutureTask.run(FutureTask.java:266) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) 在 java.util.concurrent.ThreadPoolExecutor 的 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180)。 runWorker(ThreadPoolExecutor.java:1142) 在 java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)

我尝试从 shell 访问,但出现错误 -

进程因错误退出:2(退出值:2)

我怀疑这与它试图获取密码的事实有关。但是,相同的命令 + 密码可以在我的终端上使用。

另一个相关问题是解释器中的属性不包含数据库名称。我将其添加为,postgresql.database但我不确定是否使用了此属性。

如果您知道如何解决,请告诉我,谢谢!

0 投票
2 回答
1463 浏览

scala - 在 zeppelin 笔记本中保存 spark 流所消耗的 kafka 消息

我在 zeppelin 笔记本中保存火花流所消耗的 kafka 消息时遇到问题。

我的代码是:

当我运行%sql select * from messages它时,它不显示任何数据,但表已定义。如果我在 Cassandra 上将保存更改为 tempTable,它将正确保存并显示数据。不明白为什么会这样。

感谢帮助。

0 投票
1 回答
399 浏览

apache-zeppelin - 在 spark 上运行的 Apache Zeppelin 发生 java ConnectionException

我想问一些关于使用 appache-zeppelin 安装的问题。

  1. 我下载了 zeppelin-0.5.5-incubating-bin-all
  2. 在 zeppelin-env.sh 中配置 export JAVA_HOME=/sparkDemo/java-1.8.0-openjdk,在 zeppelin-site.xml 中配置 zeppelin.server.port 8084。我没有在 zeppelin-env.sh 中配置 SPARK_HOME,因为我想使用 Zeppelin 嵌入式 Spark 库。

但是当我在窗口浏览器中运行 zeppelin 教程代码时,出现以下错误:在此处输入图像描述

即使我配置了 SPARK_HOME,在 zeppelin-env.sh 中导出 MASTER 并在 zeppelin Web UI 中创建新的解释器,也会发生同样的错误。

非常感谢您回复我! 堆栈跟踪在这里