“apache-zeppelin”的相关标签问题

0 投票

1 回答

12362 浏览

apache-zeppelin - 如何在 apache zeppelin 中获得超过 100 个的 sql 结果？

当我在 apache-zeppelin 中执行此查询时，我只得到 100 个结果，“结果受 100 个限制”。信息。

所以我在 SQL 查询中附加了“限制 10000”，但它再次只返回 100 个结果。

那么，如何在 zeppelin 中获得超过 100 个的 sql 结果？

apache-zeppelin

2016-01-13T04:45:07.680

0 投票

1 回答

592 浏览

maven-3 - 构建 Zeppelin 时出现错误

我git clone https://github.com/apache/incubator-zeppelin使用mvn clean package -U -DskipTests. 但是控制台给了我以下错误信息< Failed to execute goal on project zeppelin-phoenix: Could not resolve dependencies for project org.apache.zeppelin:zeppelin-phoenix:jar:0.6.0-incubating-SNAPSHOT: Could not find artifact sqlline:sqlline:jar:1.1.8 in public (http://maven.dev.sh.ctripcorp.com:8081/nexus/content/repositories/public) -> [Help 1]>，我正在想办法解决。但这似乎没用。任何人都可以帮助我并解决它吗？

maven-3 apache-zeppelin

2016-01-13T10:31:59.330

0 投票

2 回答

1289 浏览

apache-zeppelin - Apache - Zeppelin 在 Ubuntu 上构建失败

我深陷其中。我已经按照这里的每一条指令（https://github.com/apache/incubator-zeppelin）安装 Apache-Zeppelin。我需要这个用于 Spark。

以下是安装在 UBUNTU (VM) 中的各种必需应用程序

从 Git Hub 克隆 Zeppelin

最初，我有 Maven 3.0 版本。建议有一个版本> 3.3..安装最新版本（3.3.9）的线程之一。

执行了以下仍然失败的命令

不知道从这里去哪里。zeppelin 文件夹中的任何设置是否需要进行任何更改？请提出建议。

apache-zeppelin

2016-01-14T02:19:57.453

0 投票

0 回答

1368 浏览

java - Zeppelin 构建失败 - 无法运行任务：“grunt --no-color”失败

我想在 OSX 10.8 上安装 Apache Zeppelin，但由于某些神秘原因构建失败。规格：Java 1.7、Maven 3.3、节点 v0.12.4 和 grunt v0.1.13。

我正在运行以下命令：

我得到以下输出：

grunt 似乎有些错误，但我不确定。

java macos maven gruntjs apache-zeppelin

2016-01-15T00:13:48.237

0 投票

2 回答

2978 浏览

scala - ClassNotFoundException：org.apache.spark.repl.SparkCommandLine

我是 Apache Zeppelin 的新手，我尝试在本地运行它。我尝试只运行一个简单的健全性检查以查看它是否sc存在并得到以下错误。

我为 pyspark 和 spark 1.5 编译它（我使用 spark 1.5）。我将内存增加到 5 GB，并将端口更改为 8091。

我不确定我做错了什么，所以我收到以下错误以及我应该如何解决它。

提前致谢

java.lang.ClassNotFoundException: org.apache.spark.repl.SparkCommandLine at java.net.URLClassLoader.findClass(URLClassLoader.java:381) at java.lang.ClassLoader.loadClass(ClassLoader.java:424) at sun.misc。 Launcher$AppClassLoader.loadClass(Launcher.java:331) at java.lang.ClassLoader.loadClass(ClassLoader.java:357) at org.apache.zeppelin.spark.SparkInterpreter.open(SparkInterpreter.java:401) at org.apache .zeppelin.interpreter.ClassloaderInterpreter.open(ClassloaderInterpreter.java:74) at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java:68) at org.apache.zeppelin.spark.PySparkInterpreter.getSparkInterpreter(PySparkInterpreter.java :485) 在 org.apache. org.apache.zeppelin.spark.PySparkInterpreter.createGatewayServerAndStartScript(PySparkInterpreter.java:174)。zeppelin.spark.PySparkInterpreter.open(PySparkInterpreter.java:152) at org.apache.zeppelin.interpreter.ClassloaderInterpreter.open(ClassloaderInterpreter.java:74) at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java: 68) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreterServer$InterpretJob.jobRun(RemoteInterpreterServer.java:302) 在 org.apache.zeppelin 的 org.apache.zeppelin.interpreter.LazyOpenInterpreter.interpret(LazyOpenInterpreter.java:92) .scheduler.Job.run(Job.java:171) at org.apache.zeppelin.scheduler.FIFOScheduler$1.run(FIFOScheduler.java:139) at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java: 511) 在 java.util.concurrent.FutureTask.run(FutureTask.java:266) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask。在 java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142) 的 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) 访问 $201(ScheduledThreadPoolExecutor.java:180)。 concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)

更新我的解决方案是将我的 scala 版本从 2.11.* 降级到 2.10.*，再次构建 Apache Spark 并运行 Zeppelin。

scala apache-spark pyspark apache-zeppelin

2016-01-15T15:48:21.530

0 投票

1 回答

1087 浏览

linux - 如何使用 linux HDInsight 更改 zeppelin 的资源

我之前使用过 Windows 版本的 HDInsight，它有一个选项卡，您可以在其中为 Zeppelin 设置每个工作节点的内核数和内存。

我按照本教程让 Zeppelin 工作： https ://azure.microsoft.com/en-us/documentation/articles/hdinsight-apache-spark-use-zeppelin-notebook/

HDInsight 的 Linux 版本使用 Ambari 来管理资源，但我似乎找不到更改 Zeppelin 设置的方法。

Zeppelin 不能作为左侧服务列表中的单独服务选择。当我在操作中选择“添加服务”时，似乎也无法添加它。
我尝试使用覆盖在 Ambari 中编辑通用 spark 配置，然后将工作节点添加到我的新配置组中，并增加自定义 spark-defaults 中的内核和 RAM 数量。（然后单击保存并重新启动所有受影响的服务。）
我尝试使用编辑火花设置
/li>

在头节点上，但 Ambari 没有接收到。

对于每次大约需要 1000-1100 秒的查询，Zeppelin 中的性能似乎保持不变。

linux apache-spark azure-hdinsight ambari apache-zeppelin

2016-01-18T17:28:41.257

0 投票

0 回答

100 浏览

java - 如何从 java 客户端启动 Apache Zeppelin 服务器？

有没有办法可以从 java 客户端启动 Apache zeppelin 服务器？

我检查了https://github.com/apache/incubator-zeppelin/blob/master/zeppelin-server/src/main/java/org/apache/zeppelin/server/ZeppelinServer.java文件。

我猜服务器是在这个文件的主要方法中启动的。如果是这样，我如何从我的 java 客户端启动服务器？

java apache apache-zeppelin

2016-01-19T11:52:18.350

0 投票

2 回答

2320 浏览

postgresql - Apache Zeppelin postgres 空指针异常

我尝试将查询连接到远程 postgres 数据库 -

我已经更新了解释器的值，但我仍然收到以下错误 -

java.lang.NullPointerException 在 org.apache.zeppelin.postgresql.PostgreSqlInterpreter.interpret(PostgreSqlInterpreter.java:288) 在 org.apache.zeppelin.postgresql.PostgreSqlInterpreter.executeSql(PostgreSqlInterpreter.java:201) 在 org.apache.zeppelin。 org.apache.zeppelin.interpreter.LazyOpenInterpreter.interpret(LazyOpenInterpreter.java:93) at org.apache.zeppelin.interpreter.remote.RemoteInterpreterServer$InterpretJob.jobRun(RemoteInterpreterServer. java:302) 在 org.apache.zeppelin.scheduler.Job.run(Job.java:171) 在 org.apache.zeppelin.scheduler.FIFOScheduler$1.run(FIFOScheduler.java:139) 在 java.util.concurrent。 Executors$RunnableAdapter.call(Executors.java:511) at java.util.concurrent.FutureTask.run(FutureTask.java:266) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) 在 java.util.concurrent.ThreadPoolExecutor 的 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180)。 runWorker(ThreadPoolExecutor.java:1142) 在 java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)

我尝试从 shell 访问，但出现错误 -

进程因错误退出：2（退出值：2）

我怀疑这与它试图获取密码的事实有关。但是，相同的命令 + 密码可以在我的终端上使用。

另一个相关问题是解释器中的属性不包含数据库名称。我将其添加为，postgresql.database但我不确定是否使用了此属性。

如果您知道如何解决，请告诉我，谢谢！

postgresql apache-spark sh apache-zeppelin

2016-01-20T16:05:00.330

0 投票

2 回答

1463 浏览

scala - 在 zeppelin 笔记本中保存 spark 流所消耗的 kafka 消息

我在 zeppelin 笔记本中保存火花流所消耗的 kafka 消息时遇到问题。

我的代码是：

当我运行%sql select * from messages它时，它不显示任何数据，但表已定义。如果我在 Cassandra 上将保存更改为 tempTable，它将正确保存并显示数据。不明白为什么会这样。

感谢帮助。

scala apache-spark apache-kafka apache-zeppelin

2016-01-24T18:36:59.943

0 投票

1 回答

399 浏览

apache-zeppelin - 在 spark 上运行的 Apache Zeppelin 发生 java ConnectionException

我想问一些关于使用 appache-zeppelin 安装的问题。

我下载了 zeppelin-0.5.5-incubating-bin-all
在 zeppelin-env.sh 中配置 export JAVA_HOME=/sparkDemo/java-1.8.0-openjdk，在 zeppelin-site.xml 中配置 zeppelin.server.port 8084。我没有在 zeppelin-env.sh 中配置 SPARK_HOME，因为我想使用 Zeppelin 嵌入式 Spark 库。

但是当我在窗口浏览器中运行 zeppelin 教程代码时，出现以下错误：在此处输入图像描述

即使我配置了 SPARK_HOME，在 zeppelin-env.sh 中导出 MASTER 并在 zeppelin Web UI 中创建新的解释器，也会发生同样的错误。

非常感谢您回复我！堆栈跟踪在这里

apache-zeppelin

2016-01-25T01:58:50.637

问题标签 [apache-zeppelin]

Reference