我知道 Apache Livy 是用于从任何地方与 spark 交互的其余接口。那么使用 Apache Livy 代替 spark-jobserver 有什么好处。使用 Livy 作为替代方案的 spark-jobserver 有哪些缺点。我在互联网上找不到太多关于此的内容。你能帮我弄清楚这一点吗?
谢谢,
我知道 Apache Livy 是用于从任何地方与 spark 交互的其余接口。那么使用 Apache Livy 代替 spark-jobserver 有什么好处。使用 Livy 作为替代方案的 spark-jobserver 有哪些缺点。我在互联网上找不到太多关于此的内容。你能帮我弄清楚这一点吗?
谢谢,
有几个与我的用例相关的主要差异。
利维的优势:
SJS优势:
此外,SJS 有更好的文档,尽管在这两种情况下,它都不全面。当然,请记住,这两个项目都是 pre v1,所以事情可能会迅速改变。
就我而言,我们最终选择了 SJS,因为我不需要提交代码片段,而 Jar 管理和 HOCOCN 配置就派上用场了。但是,我正在考虑在不久的将来重新访问 Livy,以进行更全面的评估。
资料来源:
截至 2018 年 9 月,Livy 和(Ooyala)Spark 作业服务器之间的唯一主要区别在于,尽管(当前版本)Livy 是针对 Spark 2.2.0 构建的,但运行 Livy 时使用的 Spark 版本并没有需要匹配用于构建 Livy 的版本。Livy 在内部处理不同 Spark 版本之间的差异。
这种行为与 Spark Job-server 不同,后者与构建它的 Spark 版本紧密耦合。