1

我正在评估 Spark Notebook,发现了三种不同的产品;1. Hue 3.9 自带 Spark notebook (beta) 2. Apache zeppelin 3. andypetrella/spark-notebook。

你能帮我了解每种产品的优缺点吗

谢谢帕尼

4

2 回答 2

2

我只玩过 Hue 和 Jupyter。

Hue 有点新,但提供的不仅仅是 Spark Notebook,它还集成了所有 Hadoop 组件(Oozie、Solr、Impala、HBase、Pig...)。

如果您想要 Pyspark 的高级编辑器,Jupyter 非常棒。Python 编辑器非常好,在 Python 社区中很受欢迎。

于 2015-09-29T01:15:48.807 回答
0

Jupyter 是一个成熟的项目,而 Spark Notebook 是一个伟大但个人的努力,作者本人最近在这里做出了很好的解释,Zeppelin 正在 Apache 孵化,所以考虑到我们有现代版本的“没有人被解雇”购买 IBM”(直到他们这样做了哈哈),而 Jupyter 就是房间里的 IBM。

查看 Cloudera 上的一些文档可能会有所帮助,例如http://blog.cloudera.com/blog/2014/08/how-to-use-ipython-notebook-with-apache-spark/(注意 Jupyter以前叫iPython Notebook)

如果您可以发布更多关于您的用例的信息,它将帮助人们回答您的问题,并且可能发布您已经完成的研究,StackOverflow 对好的问题有特定的要求,并且重点是先尝试一些东西并发布代码。您的问题可能更适合另一个 StackExchange 站点。

如果你看这里,你会得到更多有趣的信息,比如 Zeppelin 更专注于在 Hadoop(和 Tachyon?我猜是一个透明层)之上运行,并且 Zeppelin 提供了一个可插入的接口,因此你可以使用更多语言进行开发。

于 2016-01-18T18:24:47.227 回答