1

Beeline 脚本是连接到 Spark/bin 中的 HiveServer2 的一种方式。

我运行了如下简单的查询。

在此处输入图像描述

在输出中,我可以看到 Map-Reduce 正在启动。

我只是想了解 Spark 中直线功能的优势是什么,因为它遵循传统的 map-reduce 执行框架?

我们可以在直线中使用 Spark RDD 功能吗?

提前致谢。

4

3 回答 3

2

Beeline 不是 Spark 的一部分。

它只是一个 HiveServer2 客户端。

您可以启动 Spark shell 并在 shell 中执行查询,但这与 Beeline 无关。由于 Beeline 与 Spark 无关。

于 2016-03-24T21:28:35.040 回答
1

这是一种方式。如果您不想使用 Mapreduce,则可以TEZ用作引擎。它在内存中运行的速度比 MR 快。

SET hive.execution.engine=tez;

但是你不能运行 spark ifrom beeline。这是一个连接到 hiveserver2 的独立应用程序。

于 2016-03-25T17:20:19.733 回答
0

补充@MondayMonkey 所说的内容。Beeline 不是 Spark 引擎的一部分。它只是一个连接到 Spark 的 Thriftserver(JDBC 服务器)的 JDBC 客户端。Beeline 提供 SQL 接口供您与 Spark SQL 交互

于 2018-05-11T14:41:04.563 回答