0

我们想在 rhel 机器上构建 presto 生产集群

其中一台机器是presto coordinator,其他都是presto worker

生产环境中最少的 presto 工人的建议是什么?

关于 presto 的更多细节:

Presto 协调器是负责解析语句、规划查询和管理 Presto 工作节点的服务器。它是 Presto 安装的“大脑”,也是客户端连接以提交执行语句的节点。每个 Presto 安装都必须有一名 Presto 协调员以及一名或多名 Presto 工作人员。出于开发或测试目的,可以配置单个 Presto 实例来执行这两个角色。


协调器跟踪每个工作人员的活动并协调查询的执行。协调器创建涉及一系列阶段的查询的逻辑模型,然后将其转换为在 Presto 工作人员集群上运行的一系列连接任务。

协调器使用 REST API 与工作人员和客户端进行通信。

工作器 Presto 工作器是 Presto 安装中的服务器,负责执行任务和处理数据。工作节点从连接器获取数据并相互交换中间数据。协调器负责从工作人员那里获取结果并将最终结果返回给客户端。

当 Presto 工作进程启动时,它会将自己通告给协调器中的发现服务器,这使得 Presto 协调器可以使用它来执行任务。

工作人员使用 REST API 与其他工作人员和 Presto 协调员进行通信。

4

1 回答 1

0

Presto Workers 的最少数量1独立于您的环境类型。例如,您可以配置 Presto Coordinator 节点以运行工作程序并获得最小的单节点设置来评估功能。根据官方指南,您可以通过在中指定以下参数来做到这一点config.properties

coordinator=true
node-scheduler.include-coordinator=true

如果没有额外的信息,如预期的用户数量、数据集的数量和大小、您的基础设施性能等,不太可能确定最小的合理生产数量......

于 2020-09-02T20:47:37.820 回答