问题标签 [apache-zeppelin]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
build - 安装 Apache Zeppelin 的构建错误
我想尽办法让 Apache Zeppelin 在我的 linux VM 上运行。我正在关注本教程:
http://madhukaudantha.blogspot.ca/2015/03/building-apache-zeppelin.html
我做了以下事情:
- git克隆到机器
- 现在尝试运行“mvn clean package”
我得到以下错误摘要,我真的需要让它运行。
我曾尝试通过他们的电子邮件 (users@zeppelin.incubator.apache.org) 联系 apache 孵化器团队,但电子邮件被退回。生病继续反弹寻找解决方案。
amazon-web-services - 如何在现有的 Apache Spark 独立集群上安装 Apache Zeppelin
我在 AWS 上有一个现有的 Apache Spark(1.3 版本)独立集群,我想安装 Apache Zeppelin。
我有一个很简单的问题,我必须在 Spark 的 master 上安装 Zeppelin 吗?
如果答案是肯定的,我可以使用该指南https://github.com/apache/incubator-zeppelin#build吗?
谢谢大家
java - 从 java getCanonicalHostName 方法使用 AWS 上的公共 IP
我正在尝试将 AWS 用作可扩展的分析工具。我正在使用 apache zeppelin 作为 Spark 集群的交互式 shell,并尝试使用 wisp 进行绘图。这导致了一个问题,因为 wisp 中的绘图方法是基于我认为的码头服务器启动 Web 应用程序。这在我的本地机器上运行良好,但在 AWS 上它不起作用,因为它获取私有 IP 地址而不是公共 IP 地址。
在 wisp 中,它用于java.net.InetAddress.getLocalHost.getCanonicalHostName
检索机器的 IP 地址。这总是返回私有 FQDN 地址。如何让 java 函数返回 AWS 提供的公共 IP 地址或 FQDN,而无需在每次启动集群和重建时对某些内容进行硬编码?
我尝试更改 /etc/hosts 和 /etc/hostname 但两者都没有效果。我真的不知道从哪里java.net.InetAddress.getLocalHost.getCanonicalHostName
得到它的地址。
非常感谢任何帮助或建议。
院长
angularjs - Apache zeppelin - 带有角度和 zeppelin 解释器的变量范围
我正在玩这个教程
https://github.com/apache/incubator-zeppelin/pull/27#issuecomment-90769401
似乎 val selectedTable的范围可以从 %%angular 解释器访问,但不能从 zeppelin 解释器访问。
例如,从 turorial 的第 2 段
}
当我使用 select 并将值从“bank”切换到“married”时,{{selectedTable}}(打印标题的%%angula 解释器)的值立即改变(除了第一次之外,没有点击播放按钮)但查询没有运行。换句话说,没有数据加载到图表中。
如果您在此 url https://youtu.be/QdjZyOkcG_w?t=15观看视频,您会看到每次选择具有不同的值时,所有查询都会一一执行。
有没有人有同样的问题?
先感谢您
installation - spark-1.4 与 zeppelin 安装
成功安装 spark 1.4 后,我尝试安装 Apache Zeppelin 用于类似笔记本的实用程序。
从其他一些在线资源中,我下载并解压缩了 zeppelin 源代码并开始使用 Maven 编译
(环境中导出的spark home)
我在大约 4 分钟内得到了不错的 INFO 输出,但是在以下情况下,事情因错误而停止:
这是错误消息:
有什么我忘记或应该事先修改的吗?
感谢你的帮助。
scala - Zeppelin SqlContext registerTempTable 问题
我正在尝试使用 zeppelin 中的 sqlContext.jsonFile 访问一些 json 数据...
以下代码执行没有任何错误:
输出 :
导入 sys.process._ sqlCon: org.apache.spark.sql.SQLContext = org.apache.spark.sql.SQLContext@7034473 jfile: org.apache.spark.sql.DataFrame = [ id: struct, content: string,标签:数组,分数:结构,会话:字符串,时间戳:bigint,tweetId:bigint,用户名:字符串] 导入 sqlContext.implicits。
接下来我验证我刚刚注册的表名
sqlCon.tableNames().foreach(println)
输出 :
jTable01
但是当我尝试运行时出现错误:
输出 :
没有这样的表 jTable01;第 1 行第 14 行
同时,当我为“银行”运行教程示例时,它可以工作....我能做出的唯一区别是,在银行教程中,我们使用的是sc.textFile,但在我的情况下,我想使用sqlContext.jsonFile。
您能否提供任何指导以解决此问题?
python - 将“SPARK_HOME”设置为什么?
安装 apache-maven-3.3.3,scala 2.11.6,然后运行:
最后:
然后运行服务器:
运行一个以 开头的简单笔记本%pyspark
,我收到一个关于py4j
找不到的错误。刚刚做了pip install py4j
(参考)。
现在我收到此错误:
我尝试将我的设置SPARK_HOME
为:/spark/python:/spark/python/lib
。没变。
ipython - Zeppelin:构造函数 org.apache.spark.api.python.PythonRDD 不存在
IPython 笔记本
按照文档(PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
)开始,然后填写:
输出:sc.textFile(filename).count() = 500
Apache Zeppelin 笔记本
输出:
(<class 'py4j.protocol.Py4JError'>, Py4JError(u'An error occurred while calling None.org.apache.spark.api.python.PythonRDD. Trace:\npy4j.Py4JException: Constructor org.apache.spark.api.python.PythonRDD([class org.apache.spark.rdd.MapPartitionsRDD, class [B, class java.util.HashMap, class java.util.ArrayList, class java.lang.Boolean, class java.lang.String, class java.lang.String, class java.util.ArrayList, class org.apache.spark.Accumulator]) does not exist\n\tat py4j.reflection.ReflectionEngine.getConstructor(ReflectionEngine.java:184)\n\tat py4j.reflection.ReflectionEngine.getConstructor(ReflectionEngine.java:202)\n\tat py4j.Gateway.invoke(Gateway.java:213)\n\tat py4j.commands.ConstructorCommand.invokeConstructor(ConstructorCommand.java:79)\n\tat py4j.commands.ConstructorCommand.execute(ConstructorCommand.java:68)\n\tat py4j.GatewayConnection.run(GatewayConnection.java:207)\n\tat java.lang.Thread.run(Thread.java:745)\n\n',), <traceback object at 0x7f3f79e24440>)
build - Zeppelin 构建失败
我正在尝试为 spark1.0.0 和 hadoop1.0.3 安装 zeppelin。
可能重复:安装 Apache Zeppelin 产生的构建错误
好吧,上面的线程并没有太大帮助。我的输出与上述线程完全相同:Web 应用程序无法编译。
我运行的命令是'mvn install -DskipTests -Dspark.version=1.0.0 -Dhadoop.version=1.0.3'
我有 maven 3.0.4 / java 1.8 / npm 1.1.4
是的,我确实已经从 git:// 切换到 https:// 并再次尝试,但没有成功。
apache-zeppelin - Apache zeppelin 进程死亡
我正在尝试在带有 Hadoop 1.0.3 和 Spark 1.4.0 的 Ubuntu14 上运行 zeppelin。我已经完成了源代码的构建,并且所有的包都成功完成了构建。但是当我运行守护进程时,它失败并说 Zeppelin 进程已经死亡。
有什么想法会出错吗?
它说它找不到肯定存在的日志文件夹和运行文件夹。