问题标签 [trino]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
presto - Presto CLI 调用 system.create_empty_partition() 错误
环境
- 急速 0.215
- presto-cli 0.215
- presto-jdbc 0.215
Presto 创建的 Hive 表
Presto JDBC 和 CLI 都插入成功
之前不存在分区“20190122”并且插入成功,这意味着将tmp目录重命名为/user/hive/warehouse/origin.db/test_part/date_key=20190122
成功。
/user/hive/warehouse/origin.db/test_part/date_key=20190122/
在 HDFS 中
但是 Presto CLI CALL system.create_empty_partition() 失败
CALL system.create_empty_partition( schema_name => 'origin', table_name => 'test_part', partition_columns => ARRAY['date_key'], partition_values => ARRAY['20190121'])
完整的错误信息
/tmp/presto-hive/
在 HDFS 中
所以
CALL system.create_empty_partition() 使用不同的“用户”来操作 hdfs?
presto - Presto 是用于存储数据的数据存储吗?
我是 Presto 的新手。我对 Presto 有一些疑问。
- Presto 是否是数据存储(数据库)?
- 如果是查询引擎?是否有任何通用查询语法可以使用连接器访问 Hive、SQL、Cassandra 数据,或者它将接受基于连接器的所有数据源查询?
- 查询执行将在 Presto 或连接的数据源端进行?
linux - PRESTO+dose presto cordinator 可以管理160个worker节点吗?
我们有一个包含 160 个工作节点的 presto 集群。
- 安装在VM机器(32G + 16 CPU)上的presto coordinator,其他都是worker机器(物理机器)
基本问题是 - - 如果带有 presto 协调器的机器可以为 160 个工人机器服务
除此之外:
我们如何为 presto 协调器(内存,cpu)进行大小调整?
协调机的最佳实践尺寸公式是什么?
Dose presto coordinator 可以处理和管理 160 台工人机器吗?,
- 剂量 Presto 协调器机器仅限于管理 X 工人机器?
崇敬 - http://prestodb.github.io/docs/current/overview/concepts.html
协调 器 Presto 协调器是负责解析语句、规划查询和管理 Presto 工作节点的服务器。它是 Presto 安装的“大脑”,也是客户端连接以提交执行语句的节点。每个 Presto 安装都必须有一名 Presto 协调员以及一名或多名 Presto 工作人员。出于开发或测试目的,可以配置单个 Presto 实例来执行这两个角色。
协调器跟踪每个工作人员的活动并协调查询的执行。协调器创建涉及一系列阶段的查询的逻辑模型,然后将其转换为在 Presto 工作人员集群上运行的一系列连接任务。
协调器使用 REST API 与工作人员和客户端进行通信。
工作 器 Presto 工作器是 Presto 安装中的服务器,负责执行任务和处理数据。工作节点从连接器获取数据并相互交换中间数据。协调器负责从工作人员那里获取结果并将最终结果返回给客户端。
当 Presto 工作进程启动时,它会将自己通告给协调器中的发现服务器,这使得 Presto 协调器可以使用它来执行任务。
工作人员使用 REST API 与其他工作人员和 Presto 协调员进行通信。
presto - presto + 如何管理 presto 服务器停止/启动/状态操作
我们在 Linux redhat 7.2 版本上安装了以下 presto 集群
presto 最新版本 - 0.216
1 名 presto 协调员
231 名 presto 工人
在每台工作机器上,我们可以使用以下命令来验证状态
并且也停止/开始作为以下
我还在谷歌中搜索可以管理 presto 状态/停止/启动的 UI,但没有看到任何关于此的内容
presto 没有附带一些可以显示集群状态并在需要时执行停止/启动操作的用户界面,这很奇怪
众所周知,presto 的唯一用户界面是显示状态并且没有停止/启动等操作
在上面的示例屏幕中,我们可以看到活动的 presto 工作人员只有 5 来自 231 ,但是这个 UI 不支持停止/启动操作,并且不显示哪个工作人员 presto 不活动
那么我们能做些什么呢?
访问每台工作机器并查看 presto 是向上还是向下,这是一个非常糟糕的主意
为什么 presto 没有可以执行停止/启动操作的集中式 UI?
例如我们对 UI 的期望,- 部分列表
. . .
java - 两个包名下的 Presto
我刚刚开始为 JSON API 开发 Presto 连接器。正如许多地方所建议的那样,我从连接器开始,做了一些更改,并按照文档example-http
中的说明部署了连接器。然后在启动服务器时出现以下错误。
然后我注意到我的代码中插件接口的包名是com.facebook.presto
它的实际实现com.facebook.presto.spi.Plugin
接口。
我是否下载了错误的代码/发行版?如果是这样,哪一个是正确的?如果不是,为什么要两个包?
linux - 如何通过配置清除 Presto 日志?
亲爱的朋友和大学
我们在一个月前安装了 preso 集群
我们对 presto 的日志感到非常惊讶
我们看到日志没有被清除 /home/presto/data/var/log
所以日志每周都会增加磁盘上的使用大小
目前所有日志都在 ~100M 左右,下个月将达到 200M
而且我们没有找到清除旧日志的方法,或者我们错过了一些东西
当然我们可以使用简单的删除语法作为
但这种解决方法应该是最新的解决方案
cassandra - 如何在 presto 中将 varchar 转换为 MAP(VARCHAR,VARCHAR)
我在 presto 中有表,名为 ("mappings") 的一列将键值对作为字符串
从 hello 中选择映射;
例如:{“foo”:“baar”,“foo1”:“bar1”}
我想将“映射”列转换为 MAP
比如 select CAST("mappings" as MAP) from hello;
这将立即引发错误。我们如何将其翻译成地图?
linux - Presto DB + 在某些 presto 工作人员宕机的情况下我们可以做什么 + 自动启动
亲爱的朋友和大学
我们安装了 presto 集群作为后续
我们对 Presto 的性能感到满意,presto 的用户界面令人印象深刻
我们是怎么注意到的
presto 协调器没有高可用性
但我们最担心的是,我们在 presto 工作人员上看不到任何自动启动配置
这意味着如果其中一个 presto 工作人员停机(据我了解),presto 无法识别此问题并在一段时间后启动 presto 工作人员
我在这里吗?
或者 Presto worker 有一些配置可以启动 presto worker,以防它在 X 分钟后停机?
presto - 在 PrestoSQL 中将行组合成一个列表
目前,我的表有三个不同的字段id1
,id2
和actions
。action
是字符串类型。例如,我的表格看起来像下面给出的表格:
如果任意数量的行的值id1
和值id2
都相同,我想组合这些行,以便该actions
字段成为字符串列表。如果没有任何行具有相同的值id1
和相同的值id2
,我仍想将actions
字段转换为列表,但仅使用一个字符串。例如,查询的输出应如下所示:
我知道 Presto 的一些基础知识,并且可以根据条件连接列,但不确定这是否可以通过查询来实现。如果这可以实现,那么推进这个逻辑的实施的好方法是什么?
presto - 检查 Presto 值映射中是否存在键
我是 Presto 的新手,不太清楚如何检查地图中是否存在密钥。当我运行SELECT
查询时,会返回此错误消息:
Key not present in map: element
添加AND contains(value_map, 'element')
不起作用
数据类型是字符串数组
返回varchar(9)
我将如何只选择“元素”中存在的记录value_map
?