问题标签 [apache-zeppelin]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-zeppelin - 如何在 apache zeppelin 中获得超过 100 个的 sql 结果?
当我在 apache-zeppelin 中执行此查询时,我只得到 100 个结果,“结果受 100 个限制”。信息。
所以我在 SQL 查询中附加了“限制 10000”,但它再次只返回 100 个结果。
那么,如何在 zeppelin 中获得超过 100 个的 sql 结果?
maven-3 - 构建 Zeppelin 时出现错误
我git clone https://github.com/apache/incubator-zeppelin
使用mvn clean package -U -DskipTests
. 但是控制台给了我以下错误信息< Failed to execute goal on project zeppelin-phoenix: Could not resolve dependencies for project org.apache.zeppelin:zeppelin-phoenix:jar:0.6.0-incubating-SNAPSHOT: Could not find artifact sqlline:sqlline:jar:1.1.8 in public (http://maven.dev.sh.ctripcorp.com:8081/nexus/content/repositories/public) -> [Help 1]
>,我正在想办法解决。但这似乎没用。任何人都可以帮助我并解决它吗?
apache-zeppelin - Apache - Zeppelin 在 Ubuntu 上构建失败
我深陷其中。我已经按照这里的每一条指令(https://github.com/apache/incubator-zeppelin)安装 Apache-Zeppelin。我需要这个用于 Spark。
以下是安装在 UBUNTU (VM) 中的各种必需应用程序
从 Git Hub 克隆 Zeppelin
最初,我有 Maven 3.0 版本。建议有一个版本> 3.3..安装最新版本(3.3.9)的线程之一。
执行了以下仍然失败的命令
不知道从这里去哪里。zeppelin 文件夹中的任何设置是否需要进行任何更改?请提出建议。
java - Zeppelin 构建失败 - 无法运行任务:“grunt --no-color”失败
我想在 OSX 10.8 上安装 Apache Zeppelin,但由于某些神秘原因构建失败。规格:Java 1.7、Maven 3.3、节点 v0.12.4 和 grunt v0.1.13。
我正在运行以下命令:
我得到以下输出:
grunt 似乎有些错误,但我不确定。
scala - ClassNotFoundException:org.apache.spark.repl.SparkCommandLine
我是 Apache Zeppelin 的新手,我尝试在本地运行它。我尝试只运行一个简单的健全性检查以查看它是否sc
存在并得到以下错误。
我为 pyspark 和 spark 1.5 编译它(我使用 spark 1.5)。我将内存增加到 5 GB,并将端口更改为 8091。
我不确定我做错了什么,所以我收到以下错误以及我应该如何解决它。
提前致谢
java.lang.ClassNotFoundException: org.apache.spark.repl.SparkCommandLine at java.net.URLClassLoader.findClass(URLClassLoader.java:381) at java.lang.ClassLoader.loadClass(ClassLoader.java:424) at sun.misc。 Launcher$AppClassLoader.loadClass(Launcher.java:331) at java.lang.ClassLoader.loadClass(ClassLoader.java:357) at org.apache.zeppelin.spark.SparkInterpreter.open(SparkInterpreter.java:401) at org.apache .zeppelin.interpreter.ClassloaderInterpreter.open(ClassloaderInterpreter.java:74) at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java:68) at org.apache.zeppelin.spark.PySparkInterpreter.getSparkInterpreter(PySparkInterpreter.java :485) 在 org.apache. org.apache.zeppelin.spark.PySparkInterpreter.createGatewayServerAndStartScript(PySparkInterpreter.java:174)。zeppelin.spark.PySparkInterpreter.open(PySparkInterpreter.java:152) at org.apache.zeppelin.interpreter.ClassloaderInterpreter.open(ClassloaderInterpreter.java:74) at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java: 68) 在 org.apache.zeppelin.interpreter.remote.RemoteInterpreterServer$InterpretJob.jobRun(RemoteInterpreterServer.java:302) 在 org.apache.zeppelin 的 org.apache.zeppelin.interpreter.LazyOpenInterpreter.interpret(LazyOpenInterpreter.java:92) .scheduler.Job.run(Job.java:171) at org.apache.zeppelin.scheduler.FIFOScheduler$1.run(FIFOScheduler.java:139) at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java: 511) 在 java.util.concurrent.FutureTask.run(FutureTask.java:266) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask。在 java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142) 的 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) 访问 $201(ScheduledThreadPoolExecutor.java:180)。 concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)
更新 我的解决方案是将我的 scala 版本从 2.11.* 降级到 2.10.*,再次构建 Apache Spark 并运行 Zeppelin。
linux - 如何使用 linux HDInsight 更改 zeppelin 的资源
我之前使用过 Windows 版本的 HDInsight,它有一个选项卡,您可以在其中为 Zeppelin 设置每个工作节点的内核数和内存。
我按照本教程让 Zeppelin 工作: https ://azure.microsoft.com/en-us/documentation/articles/hdinsight-apache-spark-use-zeppelin-notebook/
HDInsight 的 Linux 版本使用 Ambari 来管理资源,但我似乎找不到更改 Zeppelin 设置的方法。
Zeppelin 不能作为左侧服务列表中的单独服务选择。当我在操作中选择“添加服务”时,似乎也无法添加它。
我尝试使用覆盖在 Ambari 中编辑通用 spark 配置,然后将工作节点添加到我的新配置组中,并增加自定义 spark-defaults 中的内核和 RAM 数量。(然后单击保存并重新启动所有受影响的服务。)
我尝试使用编辑火花设置
/li>
在头节点上,但 Ambari 没有接收到。
对于每次大约需要 1000-1100 秒的查询,Zeppelin 中的性能似乎保持不变。
java - 如何从 java 客户端启动 Apache Zeppelin 服务器?
有没有办法可以从 java 客户端启动 Apache zeppelin 服务器?
我猜服务器是在这个文件的主要方法中启动的。如果是这样,我如何从我的 java 客户端启动服务器?
postgresql - Apache Zeppelin postgres 空指针异常
我尝试将查询连接到远程 postgres 数据库 -
我已经更新了解释器的值,但我仍然收到以下错误 -
java.lang.NullPointerException 在 org.apache.zeppelin.postgresql.PostgreSqlInterpreter.interpret(PostgreSqlInterpreter.java:288) 在 org.apache.zeppelin.postgresql.PostgreSqlInterpreter.executeSql(PostgreSqlInterpreter.java:201) 在 org.apache.zeppelin。 org.apache.zeppelin.interpreter.LazyOpenInterpreter.interpret(LazyOpenInterpreter.java:93) at org.apache.zeppelin.interpreter.remote.RemoteInterpreterServer$InterpretJob.jobRun(RemoteInterpreterServer. java:302) 在 org.apache.zeppelin.scheduler.Job.run(Job.java:171) 在 org.apache.zeppelin.scheduler.FIFOScheduler$1.run(FIFOScheduler.java:139) 在 java.util.concurrent。 Executors$RunnableAdapter.call(Executors.java:511) at java.util.concurrent.FutureTask.run(FutureTask.java:266) 在 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) 在 java.util.concurrent.ThreadPoolExecutor 的 java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180)。 runWorker(ThreadPoolExecutor.java:1142) 在 java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 在 java.lang.Thread.run(Thread.java:745)
我尝试从 shell 访问,但出现错误 -
进程因错误退出:2(退出值:2)
我怀疑这与它试图获取密码的事实有关。但是,相同的命令 + 密码可以在我的终端上使用。
另一个相关问题是解释器中的属性不包含数据库名称。我将其添加为,postgresql.database
但我不确定是否使用了此属性。
如果您知道如何解决,请告诉我,谢谢!
scala - 在 zeppelin 笔记本中保存 spark 流所消耗的 kafka 消息
我在 zeppelin 笔记本中保存火花流所消耗的 kafka 消息时遇到问题。
我的代码是:
当我运行%sql select * from messages
它时,它不显示任何数据,但表已定义。如果我在 Cassandra 上将保存更改为 tempTable,它将正确保存并显示数据。不明白为什么会这样。
感谢帮助。
apache-zeppelin - 在 spark 上运行的 Apache Zeppelin 发生 java ConnectionException
我想问一些关于使用 appache-zeppelin 安装的问题。
- 我下载了 zeppelin-0.5.5-incubating-bin-all
- 在 zeppelin-env.sh 中配置 export JAVA_HOME=/sparkDemo/java-1.8.0-openjdk,在 zeppelin-site.xml 中配置 zeppelin.server.port 8084。我没有在 zeppelin-env.sh 中配置 SPARK_HOME,因为我想使用 Zeppelin 嵌入式 Spark 库。
但是当我在窗口浏览器中运行 zeppelin 教程代码时,出现以下错误:在此处输入图像描述
即使我配置了 SPARK_HOME,在 zeppelin-env.sh 中导出 MASTER 并在 zeppelin Web UI 中创建新的解释器,也会发生同样的错误。
非常感谢您回复我! 堆栈跟踪在这里